問題

今日から対象データを増やして(約一万人)解析しようとして手始めに全体のネットワークを書いてみようかなー。
と思ったところ僕のノートPC(8G)ではメモリに収まらず断念。
ただたったの1万ノードでメモリが逝ってしまうのは妙な気がしたので次数分布をplot!

おふぅっ、、、
て声が出ちゃうレベルに平均して次数が高い!
べき分布といえど裾野が裾野ってほど小さくない!
そういえば共同研究は一回きりの関係が多いと有田先生がおっしゃっていたような、、、
よって共同研究の回数でフィルタリングor拾ってくるデータの対象期間を縮める、のふた手が思いついたが、後者は先に挙げた’一回きりの関係’によって重要な情報の重みが霞んでしまうと考えられる。
よって前者!
ちょうど研究課題のデータから情報抽出しようと考えていたのでまあいいタイミングで問題に気づけてよかった。