TWITTER VERİLERİNİN KNIME İLE İNCELENMESİ
Knime projesi oluşturmadan önce Twitter
verilerine ulaşabilmek için login olup apps.twitter.com adresinden twitter
application oluşturuyoruz.
Uygulama oluştuktan sonra Keys and Access Tokens ayarlarından bizim için key oluşturmasını
istiyoruz.
Sonrasında yeni bir Knime projesi oluşturuyoruz ve ilk node
olarak Twitter Api Connector’u
seçiyoruz. Sonrasında twitter uygulamamızdaki API key, API secret, Access
token, Access token secret bilgilerini configure ayarları ekranındaki alanlara
yazıyoruz.
Sonrasında sırasıyla aşağıdaki node’ları ekleyerek basit
bir uygulama yaptım. Twitter search
node’u ile ne arayacağımızı ayarlıyoruz.
Uygulamamız verileri çekmeye başladıktan sonra çeşitli
filtreler ile gruplamalar yapabiliriz.
Uygulamamda twitter kullanıcılarının @iettdestek hesabına
yazmış oldukları tweet’leri alıp üzerinde birkaç işlem gerçekleştirdim.
Twitter’dan gelen ilk verileri bir doküman olarak alıp üzerinde bazı
textprocessing işlemleri yapmak için StringsTo
Document node’u ekliyoruz. Artık her tweet’i bir dökümanın bir satırı
olarak düşünüp cümleyi kelime kelime ayırmak için sırasıyla Bag of Words Creator >Punctuation
Erasure>Number Filter>Stop Word filter düğümlerini ekliyoruz.
TF node’u
ile ayırdığımız kelimelerin frekanslarını buluyoruz ve group by configure ile veri kümesinde yani işlenmiş olan
dökümanımızdaki frekansını bulduğumuz kelimelerin toplamda kaç kez geçtiğini
ayarlıyoruz. Sonrasında sorter en çok
kullanılan kelimeleri azalan sıra ile sıraladıktan sonra görsel bir sonuç elde
etmek için Tag Cloud ekledim.
Twitter kullanıcıları @iettdestek hesabına en çok bu kelimelerle tweet
atmış:
Son olarak aynı işlemi Twitter
Timeline node’una bağlayarak @iettdestek hesabının gelen mention’lara
verdiği yanıtlara uyguladım ve şöyle bir görsel elde ettim:
KNIME ortamında çok daha işlevsel veri analizleri yapmak mümkün veri madenciliğine yeni başlayanlar için basit ve eğlenceli bir giriş uygulamasını sizlerle paylaştım, umarım faydalı bir içerik olmuştur.