TWITTER VERİLERİNİN KNIME İLE İNCELENMESİ

Twitter verilerine ulaşabilmek için login olup  apps.twitter.com adresinden  twitter application oluşturuyoruz.


Uygulama oluştuktan sonra Keys and Access Tokens ayarlarından bizim için key oluşturmasını istiyoruz.
Sonrasında yeni bir Knime projesi oluşturuyoruz ve ilk node olarak Twitter Api Connector’u seçiyoruz. Sonrasında twitter uygulamamızdaki API key, API secret, Access token, Access token secret bilgilerini configure ayarları ekranındaki alanlara yazıyoruz.

Sonrasında sırasıyla aşağıdaki node’ları ekleyerek basit bir uygulama yaptım. Twitter search node’u ile ne arayacağımızı ayarlıyoruz.
Uygulamamız verileri çekmeye başladıktan sonra çeşitli filtreler ile gruplamalar yapabiliriz.
Uygulamamda twitter kullanıcılarının @iettdestek hesabına yazmış oldukları tweet’leri alıp üzerinde birkaç işlem gerçekleştirdim.

Twitter’dan gelen ilk verileri bir doküman olarak alıp üzerinde bazı textprocessing işlemleri yapmak için StringsTo Document node’u ekliyoruz. Artık her tweet’i bir dökümanın bir satırı olarak düşünüp cümleyi kelime kelime ayırmak için sırasıyla Bag of Words Creator >Punctuation Erasure>Number Filter>Stop Word filter düğümlerini ekliyoruz.


TF node’u ile ayırdığımız kelimelerin frekanslarını buluyoruz ve group by configure ile veri kümesinde yani işlenmiş olan dökümanımızdaki frekansını bulduğumuz kelimelerin toplamda kaç kez geçtiğini ayarlıyoruz. Sonrasında sorter en çok kullanılan kelimeleri azalan sıra ile sıraladıktan sonra görsel bir sonuç elde etmek için Tag Cloud ekledim.

Twitter kullanıcıları @iettdestek hesabına en çok bu kelimelerle tweet atmış:

Son olarak aynı işlemi Twitter Timeline node’una bağlayarak @iettdestek hesabının gelen mention’lara verdiği yanıtlara uyguladım ve şöyle bir görsel elde ettim:

KNIME ortamında çok daha işlevsel veri analizleri yapmak mümkün veri madenciliğine yeni başlayanlar için basit ve eğlenceli bir giriş uygulamasını sizlerle paylaştım, umarım faydalı bir içerik olmuştur.

Bu blogdaki popüler yayınlar

Qad Kafani İlmu Rabbi

YAZILIM MİMARİSİ ve TASARIM DESENLERİ (Software Architecture and Design Patterns)

Facade Design Pattern