05.01.2007

Etiketler, Kümelenme ve Uzun Kuyruk

Internet Ekonomisinde Uzun Kuyruk Ne Demek?“ yazısında uzun kuyruk teriminin ekonomi dışındaki konulara da açıklık getirebileceğine değinilmişti. Bunlardan bir tanesi de son dönemde çok revaçta olan etiketleme sistemleri ve bunları ‘gezinilebilir’ kılarken karşılaşılan güçlükler. Aslında biraz ayrıntıya kaçan bir konu ama lafı geçmişken değinebiliriz…

Düğümküme sitesinde “tasarım, sanat, yazılım, internet, …” şeklinde kullanım sıklığına göre sıralanmış olan etiket bulutunun grafiği çizildiğinde bir ‘uzun kuyruk’ çıkıyor karşımıza. Aynı grafiğin benzerlerini Flickr, del.icio.us gibi sitelerdeki etiketlerde de oluşturmak mümkün.

Etiketleme sistemlerinde, işlemin etiketleyenlerin inisiyatifinde olması ve bunun katı kuralları olmaması, getirdiği pratikliğin yanında kullanıcının bazı bilgilere ulaşmasını da zorlaştırabiliyor. Etiketleyicilerin her zaman doğru bilgileri girdiklerini varsaysak bile, dildeki eş anlamlı, yakın anlamlı, sesteş kelimeler ve değişik dillerde girilen etiketler karmaşa veya kopukluk yaratabiliyor. Bu sorunu çözmek için etiketler, kümeleme (clustering) yoluyla sınıflandırılıyor ve birbiriyle ilgili etiketlerin bir arada olması sağlanıyor. Bu konuda başarılı gözüken Flickr, örneğin “turkey” etiketini dört cluster’a ayırmış ve etiketlerin birbirleriyle bağlantılarından yola çıkarak ülke ile kuş isminin ayrı gruplarda yer almasını sağlamış. Grigory Begelman, Philipp Keller ve Frank Smadja, Automated Tag Clustering: Improving search and exploration in the tag space isimli yazılarında bu tip cluster’lar otomatik olarak oluşturulurken nelere dikkat edilmesi gerektiğini anlatıyorlar ve bu arada uzun kuyruk fenomenine de değiniyorlar. Etiketlerin birbirleriyle ilişkileri hesaplanırken, popülaritenin dikkate alınmaması gerektiği savunulurken çok popüler olan “web2.0″ etiketi örnek gösteriliyor ve bu popülarite eğer bağlantılar arasında ağırlık katsayısına yansırsa etiketler arasında ilişkiyi göstermek yerine gereksiz bir sürü bağlantı oluşturacağı söyleniyor. Bu sebepten blog’ların başarısının ardında yatan uzun kuyruğun kesilip atılmaması; ilişkilerin, ortak bağlantı toplamına göre değil; bu toplamın, etiketlerin kurdukları bütün bağlara oranlanması ile hesaplanan olasılıklara dayandırılmasını öneriyorlar. Bunun yanında, uzun kuyruğun karanlık bir tarafı da var. Örneğin del.icio.us gibi bir sitede bir etiketin popüler olması ona olan güvenilirliği de artırıyor, kuyruğun ucuna gidildikçe özensiz veya kötü niyetli bilgilerin araya karışma olasılığı da artıyor. Bu da popülerliği arka planda bırakmanın getirebileceği bir sorun.

Etiketler

, , , , , ,

Geri beslemeler (Trackback)

Trackback Adresi
  1. düğümküme » Düğümküme’de Yenilikler

Yorum Yaz