ここでは、サポートされているデータファイルはどれか、ファイルの大まかな構造はどうなっているかなど、グラフ形式のそれぞれについて簡単に説明します。ファイルのインポートやエクスポート時に問題が発生した場合は、このページの説明を充実させるためにも、発生した問題を開発チームに知らせてください。

インポート

Gephi では、以下に示す標準的なグラフファイル形式をインポートすることができます。リンク先のページでは、それぞれのファイル形式に関する説明、サンプル、実装の詳細を参照することができます。これらの情報を参考にすれば、グラフファイル形式相互間の違いを把握することができます。

* GEXF

* GDF

* GML

* GraphML

* Pajek NET

* GraphViz DOT

* CSV

* UCINET DL

* Tulip TPL

* Netdraw VNA

比較

データをどの形式でエクスポートするか迷ったときは、次に示す表を参考にしてください。Gephi でのみ作業する場合は、さまざまな理由から GEXF を使用することを推奨します。次の表では、それぞれの形式のすべての機能ではなく、Gephi に関連のあるものだけを取り上げていることに注意してください。

グラフ形式比較表

注釈:

* 可視化属性: ノードの位置、色、およびサイズの属性を認識できるのは、GraphML、GDF、および GEXF インポータだけです。Pajek NET ファイル中の位置も認識されます。
* 階層グラフ: Gephi 0.7 以降で実装されています。
* 動的: 詳細については、GEXF の仕様のページを参照してください。

コンセプト

データ中心

グラフファイルに含まれていて、Gephi にとって不可欠なデータは何でしょうか。Gephi では、3 つの種類のデータを区別します。すなわち、ノードエッジ、および属性です。 簡単に言うと、エッジは常に 2 つのノード間にあるもので、属性はノードまたはエッジに関連付けられたデータです。たとえば、文字列の結果や整数の結果などです。

ノードとエッジが作る構造は、ネットワークトポロジーと呼ばれます。一方、属性はネットワークデータと呼ばれます。構造 (すなわちトポロジー) はあらゆるグラフに不可欠ですが、データは省略可能です。ただし、今日では、データ属性に基づくネットワーク分析が大きく注目されています。データはあらゆるところにあります。

属性

属性にはたくさんのデータを格納することができます。コンセプトは、テーブルデータや SQL と同じです。属性は、タイトル/名前を持っています。属性の名前/タイトルは、グラフ全体に対して宣言しなければなりません。たとえば、‘degree’、‘valid’、‘url’などです。カラムには、属性の名前のほかに、種類も含まれます。属性システムの詳細については、「Gephi 開発者ハンドブック」を参照してください。

次に示すノードの定義を見ると、属性について理解できるのではないでしょうか。ネイティブフィールド (id、label) に加えて、3 つの属性に値が設定されています。

<node id="0" label="Hello world">
<attvalues>
<attvalue for="0" value="samplevalue"/>
<attvalue for="1" value="1831"/>
<attvalue for="2" value="true"/>
</attvalues>
</node>