Google bu kadar mı taciz edilir! :(

0
FZ
Geçen hafta bir dostumun ağabeyinin yüksek lisans tezini Internet´e yerleştirmiş ve burada haberini geçmiştim (http://www.fazlamesai.net/modules.php?name=News&file=article&sid=2349). Sonra da arkadaşımın sorması üzerine ona açıklama yapmıştım Google anında yakalar bu yeni belgeyi, PDF´nin de içini açar okur, indeksler filan. Birkaç gün önce Google´a baktığımda ve "veri zarflama" anahtar sözcüklerini arattığımda gerçekten de ilk sayfada ilgili tezin ve bağlantılı linklerin geldiğini gördüm. Arkadaşıma da söyledim, sevindi filan. Ancak bugün baktığımda beni dumura uğratan bir durumla karşılaştım!
13 Eylül 2004 tarihi itibari ile Google´da "veri zarflama" aratınca (http://www.google.com/search?q=veri+zarflama) evet, ilgili tez de geliyor ilk sayfada ama Google´ın ilk döndürdüğü sonuç şöyle bir şey: http://veri-zarflama-analizi.ki.espero-site.com/ Gidip bakmanıza gerek yok, ne olduğunu ben söyleyeyim bir prn0 sitesi! Alan adında veri-zarflama geçen bir prn0 sitesi. Var mı böyle bir şey arkadaş dedim, bir yaşıma daha girdim. Bir arama motoru bu kadar mı taciz edilebilir, bir algoritma bu kadar mı suistimal edilir dedim. (Ofisteki programcı arkadaşlardan birine söylemiştim, tabii o esnada haberim yoktu, aç bir Google´a falancaya bak demiştim, arkadaşım, "vaaay, bu veri zarflama analizi çok güzel bir konuymuş ben de ilgilenmek istiyorum" deyince kıllandım tabii! Sonra da duruma uyandık ;-)

Son söz: Bunun önüne geçmenin bir yolu var mıdır?

Görüşler

0
pirx
Nasıl engellenir onu bilemiyorum ama, işin ilginç yanı adamların alan adında "veri-zarflama" kelimesi yok. Tamamen başka bir kelime. Nasıl oluyorda aranan kelimeden dönen sonuca kendi alan adını ekleyip yönlendiriyor hayret doğrusu. İlk defa karşılaştım bu tip bir durumla.
0
pirx
Bu arada espero-site diye aradım ve bu garip yönlendirmeden nasibini almış pek çok kelimeyle karşılaştım. "bebekler" veya "kısa-mj" gibi.

Bu nasıl bir hinliktir yarabbi. Benim anlamadığım, bu malum içerikli sitelerin hiti artsa ne olacak? Hitine göre reklam alamazlar ya? Veya millet şans eseri siteye girip paralı üyelik sistemine mi kayıt olacaktır diye umuyorlar acaba?
0
abakana
Aaaa... Google' da bişiler ararken ek anahtar kelimeleriniz hazır!

(-xxx) -sex -cum

http://flcd.org/wordpress/index.php?p=53
0
FZ
Oktay biraderimiz çözmüş mevzuyu ;-)
0
murat09
Google nin arama algoritması çok da sağlıklı değil. Misal, siz leylekler üzerine içinde leylek kelimesi geçen ve kolay indexlenebilen (html uzantılı ve hızlı yüklenen mesela) bir site yapsanız, Google'da bunu indeksleyip arşivine alsa bile, eğer site isminizde (subdomainizde de olabilir bu) "leylek" kelimesi geçmiyorsa, içinde leylekler değil de kazlar olan bir siteyi sırf ismi leylekler.leylek.kazlar.com olduğu için arama sıralanmasında sizin o nadide ve güzel sitenizden daha üstlerde görüntüleyecektir.
Aynı örnek en son 23 Nisan Çocuk Bayramı'nda rezilötesi sitelerle karşılaşan ve bilgisayarına yüzlerce malware-spyware bulaşan Türk kullanıcıları içinde verilebilir.
Google her methedildiğinde maalesef kendi içindeki bu aptal arama algoritmasını düzelteceğine, Nasdaq'ta daha da yükselmeye uğraşıyor. http://www.fazlamesai.net/modules.php?name=News&file=article&sid=2365&mode=&order=0&thold=0 'ta "Editörün Notu: Google sessiz ve derinden evrensel bilgi işlem platformu olma yolunda ilerliyor. Amazon da benzer yolda. " demişsiniz. Google ve Amazon neticede birer TICARI firmadır. Bizim gözümüze Google nerdeyse her sitede reklam sokuyorsa, kendisine güvenen kullanıcıların ve bizimde beklediklerimizi vermek zorundadır. (Şahsi kanaatim Google'nin Büyük Biraderin ta kendisi olduğu yönündedir o ayrı mesele) Bu ne mi olabilir, arama algoritmasını anlayıp anlık sub-domain ler yaratan porno/spam sitelerinin bu beklentilerini boşa çıkaracak mantıklı bir arama algoritması kullanmak gibi.
Google algoritması düzelene kadar "Veri zarflama" için doğru arama sonuçları isterseniz şimdilik şu adresi verebilirim:
http://search.msn.com/results.aspx?FORM=MSNH&q=%22veri%20zarflama%22%20
0
malkocoglu_2
||sırf ismi leylekler.leylek.kazlar.com olduğu için
||arama sıralanmasında sizin o nadide ve güzel
||sitenizden daha üstlerde görüntüleyecektir.

Bu da yazilim algoritmasi acisindan mantikli degil mi?

||Google her methedildiğinde maalesef kendi
||içindeki bu aptal arama algoritmasını
||düzelteceğine,
||Nasdaq'ta daha da yükselmeye uğraşıyor.

Google'in arama algoritmasi oteki sirketlerden olan farkinin belkemigini olusturur. 80'lerdeki Hesapsal Ogrenim Teorisinden cikan Support for Vector Machines adli algoritmayi kullaniyorlar, ve bu algoritmayi iyilestirdiler... SVM, yapay ogrenimde en populer algoritmalardan biridir. Google'in da bilahere populer olmasinin sebebi teknolojileridir derim. "Aradigimizi daha rahat buluyoruz" diye insanlar google'i seciyorlar.

En son bahsedilen durumu yakindan incelemedim, fakat Internet'in yapisal eksiklerinden dogan bir durumun bu olayi yarattigi gibi bir ilk intibam var.

||Google ve Amazon neticede birer TICARI firmadır

.. ve bunun sonucu olarak serbest piyasa kurallari isleyecek, bu tip yakinmalar yeteri derecede karliliklarini etkilerse, teknik bir cozum bulunacaktir.

||Bizim gözümüze Google nerdeyse her sitede
||reklam sokuyorsa

Google'in kendi sitesindeki reklamlardan mi bahsediyor sunuz? Bu reklamlarin sayisi hala cok az. Ve bence hala siteyi gayet yalin bir sekilde tutmayi basariyorlar.

0
murat09
1- leylekler.leylek.kazlar.com un içinde leyleklerle ilgili bilgi olmadığı halde daha üstte görüntülenmesi güzel değil, FELAKET bir sonuçtur. Buna ister yazılım algoritması felaketi deyin, isterseniz saçmalık, sonuçta felaket derecede saçma sonuçlar doğurur.
2- '"Aradigimizi daha rahat buluyoruz" diye insanlar google'i seciyorlar' diyorsanız sizde Googlenin hatalarını başka hataları eleştirdiğiniz kadar objektifçe eleştirmelisiniz. Google SVM sinin hata vermesine yol açıyor diye kimsenin Internet'in ana yapısını değiştirmeye kalkmak için yola çıkacağını sanmıyorum.
3- Bilakis rekabet koşullarının rekabet edenlerin teknik donanımını geliştirmesine sebep verdiğini bildiğim için, serbest rekabet ve ticarete destek veririm.
4- Google reklamlarından bahsediyorum, Google'daki reklamlardan değil. Yani pek çok sitede üstte veya yanda küçük yazılarla sponsorlarına tıklattıran Google Ad-Sense'den.

Son olarak;
Google nin güzel dediğiniz ama olmayan domainleri listeleyen bozuk ve saçma algoritması yenilenmedikçe, BT sektöründe son kullanıcılara Google'yi internete çıkış noktası gösterme anlayışı artık değişmeli. Farkında mısınız bilmiyorum, browser adres çubuğuna 'www.leylekler.leylek.com' yazmak yerine Google arama kutusuna artık insanlar adres yazmaya başladı. E-Dönüşümde bu hiçte olumlu bir adım değil. Google Kıble değildir, lütfen -şahsi algılamayınız- hepimiz objektif davranalım.
0
malkocoglu_2
||leylekler.leylek.kazlar.com un içinde leyleklerle
||ilgili bilgi olmadığı halde daha üstte
||görüntülenmesi güzel
||değil, FELAKET bir sonuçtur

Eldeki teknolojinin sInIrlarini bilirseniz, daha gercekci seyler isteyebilirsiniz (bugun icin). Eger indeksleme islemini tamamiyle otomize etmek istiyorsaniz, gunumuzun yapay zeka teknoloji sInIrlari bunlardir. Tabii ki gelisme devam edecektir, ileride de daha iyisi olacaktir.

0
malkocoglu_2
Bir de::

Arama motorlari piyasasi, rekabetin oldukca iyi isledigi piyasalardan biri. Yeni baslayan sirketlere acik, yani piyasaya giris yapabilme (market penetration) diger yazilim sektorlere gore daha cabuk. Mesela isletim sistemi piyasasina giris zordur. Az sayida oyuncu vardir, ve o piyasaya yirtinsaniz bir centik zor atarsiniz; Cunku insanlarin masasinin, dizinin, vs ustunde duran bir seyi degistirmek pesindesiniz. Isiniz, bedavaya satmiyorsaniz, cok zor.

Fakat arama motorlari boyle degil. Kendine guvenen her babayigit makineleri kurar, matematigini, YZ, YO algoritmalarini carklarini kurar ve baslar indekslemeye... Iste BU PIYASA icinde begenilmeyen bir durum icin tek sirketi suclama tonlariyla yermek biraz acaiptir. Kaldi ki bahsettiginiz degisiklik bir acidan basit bir akilli tahmin (heuristic) eklemesi bile olabilir. Ama bahsettiginiz seklin dogru olup olmadigi (bence yanlis) niye yapilmadigi gibi konular, hele bahsettiginiz seviyede bu sekildeki bir piyasanin zirt diye duzeltebilecegi bir sey oldugu icin, niye yapilmamistir sorusunda "merak seviyesi kuskudan daha fazla" bir sekilde yaklasmak (bence) daha iyi olacaktir.


0
sundance
Tabi ki objektif davranalım.

92 yılından beri Internet'e giriyorum. O zamanların gopher bazlı search engineleri dahil olmak üzere Google'ın yaklaşımlarından herhangi birinde (usenet search, text ads, image browsing vs.) yarısı kadar başarılı olmuş bir başka arama motoru dahi göremedim.

Dahası bu yapılan işleri, düz piyasa mantığında (banner boyutları ile oynayarak, daha güzel görseller koyarak vs.) değil, gerçekten surf yapmayı minimum ölçüde etkileyecek (gerek bant genişliği, gerek ekranda yerleşim, gerekse hedef kitle yönelimi) şekilde "akıllı" yapmaları, benim Google'a saygı duymamın sebepleri. İsterseniz bunları tartışalım.

Hal böyleyken, search bar yerine google'ın içine url yazanlar varsa bu bence öncelikle onların salaklığı, sonra Google'ın başarısıdır.

Not: "Algoritmasını düzeltmektense Nasdaq'da değerini arttırmaya çalışıyor" Google'ın NASDAQ'da ne kadar süredir varolduğu ve böyle bir algoritmanın geliştirilmesi/düzeltilmesi gibi şeylerin ne kadar devasa işler olduğu gözönüne alınırsa objektiflikten uzak bir ifade. Bende hafifçe "ulan herkes bir Google da google tutturmuş" tepkisi içeriyor gibi geliyor.
0
FZ
Az önce arama sayfasının dibindeki `` Dissatisfied? Help us improve´´ bağına tıklayıp karşıma gelen forma şikayetimi yazdım. 24/48 saat içinde düzelirse takdir edeceğim adamları ;-)
0
bm
Wildcard DNS kayitlariyla yapiyorlar bunu. Malesef DNS protokolunde 'bu wildcard kayittan geliyor' diye haber vermnin yolu yok. Hatirlarsaniz ayni halti *.com icin Verisign da yemisti. Bir suru sacma sapan ismi deneyerek belki kaydin wildcard olduguna kanaat getirmek mumkun ama o da bu sefer normal kullanimdakilerin de zarar gormesi mevzu bahis oluyor.

Hangi kelime komabinasyonlarinin anahtar olarak google'da veya baska yerde arandigini bir sekilde ogreniyor olmali bu insanlar. Cunku o siteyi bir sekilde googlebot'a buldurmalari lazim. Acaba spyware mi kullaniyorlar yoksa proxy loglarini mi satin aliyorlar? (belki ikisi de). Belki arama motoru sirketleriyle baglantilari var?

0
bio
Muhtemelen spyware.

Sacma subdomain'ler deneyerek wildcard testi yapabilirler, ama kisa vadeli bir cozum olur. Bu durumda spammer'lar wildcard kullanmak yerine gercekten her subdomain'i DNS'e register etme yoluna giderler.

Belki Google'in sadece ikinci seviye alan adlarini indexleyip, subdomain'leri ve directory/dosya adlarini dikkate almamasi dusunulebilir.

Hatta ben Google'in yerinde olsam 20 kisilik bir ekip kurup 7/24 bu tur aramalar yaptirir, spam amacli wildcard domain'leri kara listeye alirim. Sonucta yapay zeka'nin limiti buysa, yapay olmayan zeka da var.

Görüş belirtmek için giriş yapın...

İlgili Yazılar

Peki... Uzaktan eğitim konusunda ne düşünüyorsunuz?

cayfer

FM'deki tartışmalardan büyük zevk alıyorum ve yararlanıyorum. Tek sorun fikirlerini öğrendiğim kesimin elit bir kesim olması. Keşke daha geniş bir kitleye erişebilsek...

Neyse, uzaktan eğitim (distance learning) araçlarıyla bilişim eğitimi verilip verilemeyeceği konusunda ne düşünüyorsunuz?

Yahoo! Kullanıcı Arayüzü Kütüphanesi

SHiBuMi

Yahoo! User Interface Library (YUI), Yahoo! tarafından geliştirilmiş, Javascript ile yazılmış, DOM scripting, DHTML ve AJAX tekniklerini kullanan, gelişmiş arayüze sahip interaktif web siteleri hazırlamak amacıyla kullanılan bir araçlar bütünü. YUI içerisindeki tüm araçlar BSD lisansı ile lisanslanmış.

İncelemeye değer bu kütüphanenin web sitesi: http://developer.yahoo.com/yui/index.html.

Efsane film 2001 Uzay Macerası`na Yeni Bir Bakış

anonim

Kubrick üstadın efsanevi filmi 2001 Uzay Macerası filmini seyretmiş olabilirsiniz. Seyretmekle kalmayıp üzerine bir ton makale, eleştiri okumuş ve kendiniz de fikir üretmiş olabilirsiniz. Bütün bunları yapmış olsanız dahi bu filme bir de şu FLASH animasyonunun sunduğu perspektiften bakmayı bir deneyin diyorum. Bir şey kaybetmezsiniz ama bir şeyler kazanabilirsiniz.

Filmi seyretmeyenler ise sanırım bu animasyonu izledikten sonra filmi bulup izlemek için ellerinden geleni yapacaklardır ;-)

Bilmediğiniz Dosya Uzantıları

FZ

".A3K hangi yazılımın dosya uzantısıydı? .ABA Palm Adress Book formatı mıydı? .ELL ATI ile mi ilgiliydi? Peki linki neydi? Yahu bu .EZC dosyasını ne ile açacağız peki?" gibi sorularla meşgul oldu iseniz ya da olma ihtimaliniz varsa o zaman size ciddi ve detaylı olarak yardımcı olacak Internet sitesi FILExt. Fazla söze gerek yok, site kendi kendini gayet güzel anlatıyor ;-)

Miranda Icq için ilk skin plugini çıktı

robin

Bir çoğunuzun severek kullandığına emin olduğum küçük ve hızlı, $ahsen "cep herkülü client ;)" diye de tabir ettiğim open source icq clienti Miranda Icq için ilk skin plugini "Lizard" çıktı. Beraberinde örnek bir skinle gelen plugin Miranda'yı daha da güzel gösterecek, hem de malum diğer client gibi kaynaklarınızı yiyip bitirmeden. :)
Plugin $u adresten çekilebilir:
http://sweb.cz/steelspace/files/Lizard.zip