Gephi: Social Network Visualization

6 min readAug 1, 2020

Inti dari tulisan ini adalah untuk menunjukkan step by step bagaimana cara membuat visualisasi jaringan sosial menggunakan Gephi. Tapi, sebelumnya akan dijabarkan dulu tentang hal-hal yang terkait dengan social network analysis-nya. Bahasa penjabarannya kaku, soalnya penulis copy-paste dari laporan TA. Neither in visualizing part.

Social Network Things

Social Network Analysis merupakan ilmu yang mempelajari tentang hubungan manusia dengan menggunakan teori graf. Implementasi Social Network Analysis mampu menggambarkan relasi atau hubungan antar aktor melalui visualisasi berbentuk graf. Relasi dalam analisis jaringan sosial dapat diolah dalam bentuk kalkulasi yang menghasilkan centrality dalam sebuah jaringan sosial sesuai dengan posisi masing-masing aktor di dalam struktur jaringan tersebut.

Social network terdapat node yang mewakili orang atau individu atau aktor. Sedangkan untuk perwakilan relasi yang terjadi antara aktor tersebut adalah edges atau link. Social network terdiri dari banyak aktor yang mempunyai relasi satu sama lain hingga membentuk peta jaringan sosial. Peta tersebut adalah graf. Graf adalah salah satu cara penggambaran relasi di dalam jaringan sosial yang memanfaatkan node dan link untuk merepresentasikan aktor dan relasinya (Susanto, 2012).

Centrality adalah penentuan aktor menggunakan ukuran (metric) pada Social Network (Oktora, 2014). Centrality dalam teori graf dan social network dibagi menjadi empat jenis, yaitu perhitungan degree centrality, betweeness centrality, closeness centrality dan eigenvector centrality (Setatama, 2017). Adapun penggunaan modularity untuk membentuk suatu komunitas atau klaster yang ada pada suatu jaringan (Alfi, 2018).

Degree Centrality
Degree centrality adalah jumlah edge yang terkoneksi pada suatu node yang mewakili interaksi.

Betweeness Centrality
Perhitungan yang mewakili seberapa banyak sebuah node dilewati node lain untuk menuju ke sebuah node di dalam jaringan. Hal ini menandakan seberapa besar suatu node diperlukan sebagai penghubung dalam penyebaran informasi di dalam jaringan. Skor betweeness Centrality mewakili seberapa besar informasi yang tersebar dari suatu aktor. Semakin besar skor, artinya aktor tersebut semakin berperan dalam luasnya penyebaran informasi.

Closeness Centrality
Closenes centrality adalah nilai kedekatan antara satu node dengan node lain dalam jaringan dengan menghitung rata-rata dari jarak relasi node-node tersebut. Skor closeness centrality mewakili kecepatan dalam penyebaran informasi.

Eigenvector Centrality
Eigenvector centrality menghitung bobot untuk mewakili seberapa pentingnya suatu node dalam jaringan. Node yang memiliki skor eigenvector centrality yang tinggi berarti terhubung dengan node lain yang mempunyai skor eigenvector centrality yang tinggi pula.

Modularity
Modularity adalah pengukuran untuk menghasilkan komunitas atau klaster yang ada pada jaringan. Pada aplikasi Gephi, algoritma perhitungan penentuan kelas berdasarkan modularity adalah menggunakan algoritma yang mengacu pada jurnal berjudul Fast unfolding of communities in large networks karya Vincent D. Blondel, Jean-Loup Guillaume, Renaud Lambiotte, dan Etienne Lefebvre.

Visualizing~

Hal yang dibutuhkan yaitu aplikasi Gephi dan data. Tambahan, instal plugin bernama Convert Excel and csv files to networks sebagai data importer.

Gephi

Gephi adalah perangkat lunak atau aplikasi open source yang digunakan untuk network analysis yang meliputi visualisasi, eksplorasi dan manipulasi suatu jaringan sosial. Aplikasi Gephi dapat diunduh di website resminya di sini.

Data

Social network membutuhkan data source dan target sebagai node. Maka dari itu, data minimal harus mempunyai dua kolom yang mewakili kedua fitur tersebut. Contoh:

Nama kolom tidak harus source dan target.

Let’s Do!

Buka Gephi, pilih File > Import. Next.

Pada poin 2, pilih file excel atau csv yang berisi data. Next.

Pada poin 3, pilih type of agents. Node diatur untuk relasinya, konsep yang akan dibutuhkan adalah node source ‘terhubung’ ke target. Maka dari itu, select source pada type of agent pertama, dan target pada type of agent kedua.

Poin 4, jika satu kolom berisi dua atau lebih node dengan separator tertentu (misal: semicolon), maka pada step ini, pilih separator yang sesuai.

Poin 5, Gephi dapat menangani dynamic network, artinya data yang diambil langsung dari platform tertentu (misal: Twitter). Tapi, pada contoh kali ini, bukan memakai data dinamis, maka next.

Pada poin 6, centang pilihan create links untuk membuat link antar node pada visualisasi dan remove self loops untuk menghapus data jika node terhubung dengan node yang sama.

Finally! Ready to import. Klik Finish.

Pilih graph type, defaultnya adalah Undirected. Ada juga informasi mengenai node dan links/edges yang terbentuk dari data tadi. Klik OK.

Menjadi seperti ini:

Draw it!

Untuk visualisasi yang lebih jelas dan menarik, akan dibuat visualisasi dengan modularity yang diwakili oleh perbedaan warna dan penggunaan skor betweenness centrality yang diwakili oleh ukuran font. Semakin besar ukuran font, semakin tinggi skor.

Pertama, hitung skor centrality. Run beberapa opsi pada bilah kanan. Average Degree untuk mendapat skor degree. Modularity untuk mengukur dan mengelompokkan node berdasarkan klaster. dan Average Path Length untuk mendapat skor betweenness centrality, closeness centrality, dan eccentricity.

Data dari skor yang didapat, dapat dilihat pada tab Data Laboratory.

Kedua, mengatur warna berdasarkan modularity. Hal tersebut dapat dilakukan dengan melihat bilah kiri, pilih ikon palette, pilih partition, lalu pada dropdown pilih modularity class, klik apply.

color node and edged based on modularity

Klik icon T di bawah untuk memunculkan nama node.

Ketiga, mengatur ukuran huruf agar mewakili skor betweenness centrality peraktor. Pilih ikon huruf T pada bilah kiri, pilih tab ranking, lalu pada dropdown pilih betweenness centrality tentukan min size dan max size untuk font, lalu apply.

font size based on betwenness centrality score

Keempat, mengatur bentuk graf. Pada bilah kiri, ada opsi layout. Pilih layout OpenOrd, atur edge cut menjadi 0 (agar tidak terjadi pengurangan node), lalu apply. Hasilnya:

Kelima, merapikan layout. Gunakan layout Yifan Hu untuk persebaran node yang lebih luas, jadi nama node akan terlihat dengan lebih jelas. Nilai optimal distance adalah opsional (default: 100).

Pewarnaan node dan edges ataupun ukuran font dapat diatur sesuai kebutuhan. Misalnya, ukuran huruf yang berdasarkan pada skor degree ataupun skor closeness centrality. Selesai.

Sedikit analisis, pada data yang diambil hanya memiliki 879 relasi antar node dengan keyword @/idwiki di Twitter, dihasilkan visualisasi seperti pada gambar layouting 2. Pada visualisasi tersebut, klaster yang terbentuk hanya satu klaster besar. Node idwiki memiliki ukuran huruf paling besar yang artinya memiliki skor betweenness centrality yang tinggi pada klasternya sendiri yaitu klaster paling besar tersebut. Artinya, idwiki mempunyai peran dalam penyebaran informasi yang luas.

Sekian tulisan saya. Semoga tutorial kali ini bermanfaat. Terima kasih.

Knowledge sources:

B. Susanto, H. Lina, and A. R. Chrismanto, “Penerapan Social Network Analysis dalam Penentuan Centrality Studi Kasus Social Network Twitter,” J. Inform., vol. 8, no. 1, 2012.
R. Oktora and A. Alamsyah, “Yang Paling Berperan Pada Event Jgtc 2013 Melalui Media Sosial Twitter ( Studi Meng- Gunakan Metode Social Net- Work Analysis ),” pp. 201–210, 2014.
M. S. Setatama, D. Tricahyono, M. M. Ir, and D. Ph, “Social Network Analysis,” vol. 2, pp. 91–104, 2017.
L. Alfi, I. Atastina, and A. Herdiani, “ANALISIS DAN IMPLEMENTASI COMMUNITY DETECTION MENGGUNAKAN ALGORITMA DBSCAN PADA TWITTER ANALYSIS AND IMPLEMENTATION OF COMMUNITY DETECTION USING,” vol. 5, no. 1, pp. 1469–1476, 2018.

Gephi: Social Network Visualization

Social Network Things

Visualizing~

Written by Putri Alvina Lutfiani