[SPARK-5963] [MLLIB] Python support for Power Iteration Clustering - ASF JIRA

XML

Word

Printable

JSON

Details

Type: Bug
Status: Closed
Priority: Major
Resolution: Duplicate
Affects Version/s: None
Fix Version/s: None
Component/s: MLlib
Labels:
None

Target Version/s:

1.4.0

Description

Add python support for the Power Iteration Clustering feature. Here is a fragment of the python API as we plan to implement it:

/**

Java stub for Python mllib PowerIterationClustering.run()
*/
def trainPowerIterationClusteringModel(
data: JavaRDD[(java.lang.Long, java.lang.Long, java.lang.Double)],
k: Int,
maxIterations: Int,
runs: Int,
initializationMode: String,
seed: java.lang.Long): PowerIterationClusteringModel = {
val picAlg = new PowerIterationClustering()
.setK(k)
.setMaxIterations(maxIterations)

try

{ picAlg.run(data.rdd.persist(StorageLevel.MEMORY_AND_DISK)) }

finally

{ data.rdd.unpersist(blocking = false) }

}

Attachments

Issue Links

is duplicated by

SPARK-5962 [MLLIB] Python support for Power Iteration Clustering

Resolved

Activity

People

Assignee:: Unassigned

Reporter:: Stephen Boesch

Votes:: 0 Vote for this issue

Watchers:: 1 Start watching this issue

Dates

Created:: 24/Feb/15 02:15

Updated:: 24/Feb/15 23:41

Resolved:: 24/Feb/15 23:41

Time Tracking

Estimated:

168h

Remaining:

168h

Logged:

Not Specified