Web tarama robotu ve sonuç sıralama algoritmasının geliştirilmesi


Tezin Türü: Doktora

Tezin Yürütüldüğü Kurum: Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye

Tezin Onay Tarihi: 2017

Öğrenci: MOHAMMED RASHAD BAKER BAKER

Danışman: MUHAMMET ALİ AKCAYOL

Özet:

Günümüzde Web tarama robotları ve sonuç sıralama algoritmaları, özellikle Web arama motorlarının performansı açısından çok önemlidir. Bu tez çalışmasında öncelikli kuyruk yapısına dayalı yeni bir Web tarama robotu algoritması geliştirilmiştir. Geliştirilen algoritma ile ziyaret edilen Web sayfalarında bulunan bilgiler veritabanına kaydedilerek indeksleme yapılmaktadır. İndeksleme işlemi sırasında ziyaret edilen Web sayfalarının meta-tag ve sayfa içeriğinde bulunan kelimeler ayıklanarak veritabanına kaydedilmektedir. Geliştirilen yeni sıralama algoritmasında Web sayfaları etiket ve sayfa içeriğine dayalı sıralanmaktadır. Yeni geliştirilen Web sıralama algoritması, PageRank ve HITS algoritmaları ile kesinlik ve duyarlık ölçütleri kullanılarak karşılaştırılmıştır. Deneysel sonuçlar geliştirilen sıralama algoritmasının PageRank ve HITS algoritmalarına göre daha başarılı sıralama yaptığını göstermiştir.