मैं क्लस्टर बनाने के लिए seaborn clustermap
का उपयोग कर रहा हूं और दृष्टि से यह बहुत अच्छा काम करता है (यह example बहुत समान परिणाम उत्पन्न करता है)।seaborn clustermap से क्लस्टर निकालने
हालांकि मैं पता लगाना प्रोग्राम समूहों को निकालने के लिए परेशानी हो रही हूँ। उदाहरण के लिए, उदाहरण के लिंक में कैसे लगाया कि 1-1 rh, 1-1 lh, 5-1 rh, 5-1 खोजने के lh एक अच्छा क्लस्टर बना सकता है? दृश्यमान यह आसान है।
import pandas as pd
import seaborn as sns
sns.set(font="monospace")
df = sns.load_dataset("brain_networks", header=[0, 1, 2], index_col=0)
used_networks = [1, 5, 6, 7, 8, 11, 12, 13, 16, 17]
used_columns = (df.columns.get_level_values("network")
.astype(int)
.isin(used_networks))
df = df.loc[:, used_columns]
network_pal = sns.cubehelix_palette(len(used_networks),
light=.9, dark=.1, reverse=True,
start=1, rot=-2)
network_lut = dict(zip(map(str, used_networks), network_pal))
networks = df.columns.get_level_values("network")
network_colors = pd.Series(networks).map(network_lut)
cmap = sns.diverging_palette(h_neg=210, h_pos=350, s=90, l=30, as_cmap=True)
result = sns.clustermap(df.corr(), row_colors=network_colors, method="average",
col_colors=network_colors, figsize=(13, 13), cmap=cmap)
मैं कैसे खींच सकते हैं मॉडल क्या है, जिसमें बाहर समूह जिनमें: मैं डेटा के माध्यम से देख के तरीकों, और dendrograms उपयोग करने के लिए कोशिश कर रहा हूँ, लेकिन मैं थोड़ी सफलता हो रही है उदाहरण से
संपादित कोड result
का?
EDIT2result
dendrogram_col
जो मुझे लगता है fcluster साथ काम करेगा साथ में यह एक linkage
साथ ले जाने के लिए है। लेकिन चयन करने के लिए दहलीज मूल्य मुझे भ्रमित कर रहा है। मुझे लगता है कि थ्रेसहोल्ड से अधिक गर्मी के मूल्य में एक साथ क्लस्टर हो जाएगा?
अरे @Marcel एम, नहीं आप एक "विषमताओं मैट्रिक्स 'के बजाय एक संबंध मैट्रिक्स का उपयोग करना चाहते हैं? '1 - एनपी.एब्स (सहसंबंध) 'या कुछ की तरह? –
@ ओ.र्का 'sns.clustermap() 'से सहसंबंधों को पास करने के सवाल में उद्धृत समुद्री उदाहरण से आता है, जिसे मैंने अभी कॉपी किया है। दोनों संस्करण सहसंबंधों के बीच दूरी की गणना करते हैं, इसलिए अंत दूरी में वास्तव में उपयोग किया जाता है, लेकिन मैं मानता हूं कि मुझे नहीं पता कि यह कितना समझ में आता है (मुझे नहीं पता कि समुद्र का उदाहरण ऐसा क्यों करता है)। अपनी परियोजना में, मैं सीधे दूरी का उपयोग करता हूं। –