Naçizane

KUSURSUZ ARAMANIN YOL HARİTASI: SEMANTİK WEB’E BAKIŞ

7 Mins read
Naçizane

KUSURSUZ ARAMANIN YOL HARİTASI: SEMANTİK WEB’E BAKIŞ

7 Mins read

Aramak, biraz bilgi bulmak veya keşfetmek çabası içinde dikkatle veya üzerinden geçerek bir şeylere bakmak diye tanımlanıyor Merriam-Webster’de. [1]

“Arama motorlarının Uzay Yolu‘nda yer alan bilgisayarlardaki gibi olduğunu görmek istiyorum. Onlarla konuşuyorsunuz ve ne sorduğunuzu anlıyorlar”. Bu sözler 100 sıfırın takip ettiği 1 anlamına gelen Google’ın Yahoo ve Excite gibi Stanford üniversitesinde doktoralarından sıkılmış ve tezlerini yazmamak için her şeyi yapabilecek kurucuları tarafından kiralanan ilk çalışan olan ve halen Google’ın Teknoloji Yöneticisi olarak çalışan Craig Silverstein’a ait. Google’ın bu keyifli çalışanı belki sözlerinde biraz mizah örneği barındırsa da, aramanın bir gün insan benzeri bir yapıya dönüşmesi fikri bu yenilikçi firmanın geleceği ile ilgili tüm tartışmaların temel dayanağı durumunda. [2]

Aramanın geleceği ile ilgili öncelikli sorunu bir şeyleri bulabilmek değil anlamak. Bir makine bir insanın ne aradığını anlayabilir mi sorusunun cevabında ise Turing testi yatıyor. [3] Silverstein, Google ve diğer arama şirketlerinin amacının insanlara istedikleri bilgiyi sağlamak ve bunu onlar için kullanışlı hale getirmek olduğunu belirtirken bu amacı gerçekleştirmek için insan seviyesinde anlayışın kaçınılmaz bir gereklilik olduğuna inanıyor.

Geleceğin inşasında atılmış olan önemli adımları incelediğimizde arama şirketlerinin ne aradığımızı, hangi sonuçlardaki linklere tıkladığımızı ve hatta daha sonra nereye gittiğimizi izleyerek sonuç sayfalarında kullanılmak üzere daha iyi algoritmalar üzerinde çalıştıklarını görüyoruz. Microsoft’un teknik liderlerinden, seçkin mühendis olan eski Yahoo arama laboratuvarı başkanı Gary Flake arama kullanımının istatistiksel örneklerini izleyerek ve bunları algoritmalara taşıyarak çok şey öğrenildiğini ifade ediyor. [4] Dilin taktik ve dilbilimsel özelliklerini belirlemek için oldukça geniş bir data frame (maddi alan) kullanılıyor. Sonuçta arama giderek daha iyiye ulaşıyor ve daha çok insan tarafından kullanılır hale geliyor. Görevi büyük orandaki hatalı hecelemeleri izlemek ve onları düzgün hecelenmiş cümleyle ilişkilendirmek olan Google arama motorundaki heceleme kontrolörü buna iyi bir örnektir.

Arama motorları hakkında daha derin bir araştırmada ise internet kullanımını yöneten bir elit grup tespit edildi. [5] Araştırmaya göre Amerikan halkının %30’u bu elit gruba dahil. Ne kadar gençsek ve eğitim düzeyimiz ne kadar yüksekse o kadar çok arama yapıyoruz. İlginç olarak daha çok arama yaptıkça daha çok internete bağlanıyor, daha dijital ve bilgi servislerine daha bağımlı hale geliyoruz. Diğer bir sonuca göre de ABD’de medya ve bilgi hizmetlerine hane halkı başına yıllık harcama mikarı 90’lı yıllar boyunca %32 artarak 365 $’dan 640 $’a yükseldi. [5]

Daniel E. Rose ve Danny Levinson’a göre [6] arama kullanıcısının davranışının “niçin”i kullanıcının bilgi ihtiyacını tatmin etmek için gerçekten önemli. Sonuç olarak kullanıcılar bilgisayarlarının başına geçip sanırım biraz arama yapacağım demiyorlar. Arama sadece bir sonuca ulaşma çabasıdır, kullanıcının başarmayı istediği bir başka bir amacın başarılması için bir araçtır. Diğer bir deyişle cevaplardan fazlası için arama yapıyoruz. Kastedilen bu enginlik bir Web körlüğüne neden oluyor: Orada bulmak isteyeceğimiz bir şey olduğu hissi ama onu nasıl bulacağımıza dair hiç bir fikrimiz olmaması. Bu yüzden bir şekilde onun bizi bulmasını umarak aramaya devam ediyoruz. Bu açmazdan yola çıkarak Amazon iyi bir iş modeli gerçekleştirdi: “Sizin aldığınız ürünü alan diğer insanlar aynı zamanda bu ürünü de aldı.”. Böylece aramanın iki özelliği ön plana çıkıyor, var olduğunu bildiğimiz bir şeye erişmek için arama ve var olduğunu hissettiğimiz ama henüz bulamadığımız bir şeyi keşfetmek için arama.

Stratejik olarak Google’ı incelediğimizde aramadan kâr elde etmek ve kendi kaderini elinde bulundurmak için üç ana elemente sahip olduğunu görüyoruz: yüksek kaliteli organik ya da diğer adıyla algoritmik bir arama motoru, ödemeli bir arama (AdWords – CPC reklam) ve kendi trafiği. İlk element Google’da çalışan teknoloji kahinlerinin en çok üzerinde durduğu ve anlamsal web ile daha ötesini dikkatle inşa etmenin en kıymetli bileşenidir. İkinci element ise reklamcılığın daha çok marjin güdümlü olacağanın bir sinyali. Gelecekte piyasa oyuncuları tekliflerinin nerede sonlandığı konusunda agnostik (bilinmezci) olacaklar, ROI (yatırım getiri) tarafından yönetilecekler. Tüm pazarlama oluşumu, 100 milyar $’lık bir endüstri, hatta neredeyse gezegendeki her iş kolu yavaşça fakat emin adımlarla insanların bir arama motorunda bir şeyler aradıkları gibi basit bir fikir ile şekillendirilmiş yeni bir modele doğru yer değiştiriyor. Belki de alışveriş sadece bir arama uygulaması haline gelecektir. Zaten Google’da yaşanan en büyük sorun (belki de sorun olarak adlandırılmamalı) bilinmeyenden roket hızıyla Microsoft gibi bilinir bir hale 5 yıl içinde gelmiş olmasıdır. Muhasebe firması Deloitte Touche Google’ı en hızlı büyüyen şirket olarak adlandırmıştı: 5 yılda geliri %437,115 artmıştı. [7]

Şimdi Google’ın cesur hedefine bir bakalım: Dünya bilgisini organize etmek ve ulaşılabilir hale getirmek. Bakın “arama” misyon olarak belirtilmiyor. Zaten arama sonuç olarak bulunması gereken bir şey. Google bize her şeyi bulmada yardımcı olmak ister. Tüm masa üzerindeki bilgisayarları unutun. Onun yerine dünyanın kompüterize edilmesi gerekiyor ve işte burada Google’ın avantajı başlıyor. Web geleceğin en büyük hesaplama platformu olma yolunda, kimseye ait değil ama herkes kullanıyor.

Birçok sorunun nesnel olarak kusursuz bir cevabının olmadığı doğruyken kusursuz arama mükemmel cevabı bulmaya bizi daha da yaklaştırıyor. Kusursuz aramadan kastım arama motorunuzun, sizin sadece bir keşif için yaptığınız yolculuk ile yeni bir şeyler bulmak için yaptığınız arama arasındaki farkı ayırt edebilmesidir. Bu, belge ile insanın arasındaki farkı ayırt etme yeteneğidir, bu durum belgeleri okumak yerine mükemmel cevabı alabilmek için bir insanla konuştuğunuz metaforu ile ifade edilebilir. Kısaca, geleceğin arama motorlarının sadece bir motor olmadığını görüyoruz. Daha çok zeki bir temsilcidir, mesela referanslı bir kütüphanecinin insanoğlunun tüm bilgilerini üstün bir şekilde derlemesidir.

Kusursuz aramadan bahsettiğimizde semantik Web’e bir kez daha referans vermemiz gerekir. Şu anda elimizin altında olan birçok derlenmiş bilgi etiketlenmedikçe, yani arama motorlarının en iyi şekilde anlayabileceği ve bunun üzerinden hizmet verebileceği bir yöntem içinde tanımlanmadıkça, bu bilgiler çoğu kez anlamsızdır. Daha zeki bir Web ve kusursuz arama içinse zayıf Web sayfalarını etiketleyerek ayıklamamız gerekir. İşte bu semantik Web’in vizyonudur. World Wide Web’in yaratıcısı Tim Berners-Lee aynı zamanda semantik Web’in de bir savunucusudur ve bu sebeple metadatayı planlayan ve tıklama akışını daha kullanılır hale gelmesini sağlayan bir taslak çizdi. [8] Berners-Lee ve diğerleri bahsettikleri bu yapı ile arama yapmayı daha kolay hale getirdi ve bir toplantı tasarlamak veya bir gezi planlamak gibi karmaşık görevlerin üstesinden geldi ve bunu şöyle açıkladılar: Ne zaman insanlar Web için çeşitli kaynaklar toplayabileceği programlar yaparsa, işte o zaman semantik Web’in gücü görülür. Web’in otomatikleşmiş servislerinin ve içeriğinin ulaşılabilir olması, yazılım müşterilerinin etkililiğini arttıracaktır. Semantik Web bu sinerjiyi ilerletir. Müşteriler birlikte çalışmadıkları halde semantik bilgiler geldiğinde birbirlerine transfer ederler. [8]

“Bana içinde en az bir sayfa Arapça içeren, Ortadoğu’da olan en azından iki benzeri belge ile bağlantılı ama Al Jazeera Web sitesi ile ilgili olmayan ve şüpheli teröristlerin listelerini veren belgeleri göster” Google’da arayamacağınız türden ama kusursuz aramanın örneklerinden bir sorgu. [9] Bu karmaşık soruya basitçe, bir sürü donanım ve metadatalar ile cevap verilebilecek. Çözümün mekanizmasını detaylandırırsak, Web’i indekslemek dışında, sonuçları anahtar kelimeler ve daha zeki algoritmalar ile analiz edip sunarak, yani semantik kategorilere sınıflandırarak bu tip sorulara cevap verilebilecek. Semantik Web yöntemleri, Web’i yeniden yapılandırıp, kullanıcıların sorularını girebilecekleri yer haline getirecektir.

Sonuç olarak, en baştaki tanıma geri dönelim. Arama tek başına bir başvuru değildir, yararlı ve kişisel araçları bulabileceğiniz bir dünyadır. Buna World Wide Web denir. Arama bir mekanizmadır ve bize kendimizi nasıl anladığımızı gösterir. Bizim nasıl yol aldığımızı ve insanoğlunun kültürüne nasıl ulaştığımızı gösterir. [9] Parmak uçlarımızın tuşladığı her bir bilgi kusursuz bir şekilde kişiselleştirilir ve hiçbir zaman bunun farkına varmazsınız, işte bu kusursuz aramadır.

Kaynakça:

[1] http://www.merriam-webster.com/dictionary/search

[2] “Interview: Craig Silverstein”, Pictures of the Future,  pp. 78-79, 2004

[3] A. Turing, “Computing Machinery and Intelligence”, Mind LIX, pp. 433-460, 1950

[4] G. W. Flake, D. M. Pennock, ve D. C. Fain, “The Self-Organized Web: The Yin to the Semantic Web’s Yang”, IEEE Intelligent Systems, pp. 82-88, 2003

[5] “Popularity of Search”, Pew Internet & American Life Project, 2004

[6] D.E. Rose, ve D. Levinson ,”Understanding user goals in web search”, 13th International conference on World Wide Web, pp. 13-19, 2004

[7] “Technology Fast 500”, Deloitte Touche & Tohmatsu,  2004

[8] T. Berners-Lee, J. Hendler, ve O. Lassila, “The Semantic Web,” Scientific American, pp. 34-43, 2001

[9] J. Battelle, “The Search: How Google and its Rivals Rewrote the Rules of Business and Transformed Our Culture”, Nicholas Brearley Publishing, Boston, 2005

 

Bir Cevap Yazın

%d blogcu bunu beğendi: