Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Youtube'dan Kötü Niyete Karşı 'Video Tanımlama Aracı'

anonim

Ülkemizde yasaklanma sebepleri ve yöntemleri tartışıladursun, Youtube ve benzeri video paylaşım sitelerinde yer alan ve yasal olmayan nitelikteki içerikle nasıl mücadele edileceği Internet'in anavatanı ABD'de de önemli bir konu.

Telekom Grevi Başladı!

parsifal

Türk Telekom'da grev bu sabah başladı.

Web 2.0: Pasif Sörfçüden Aktif Internet Katılımcısına Geçiş

FZ

Dün akşamki FM TV programında "Web 2.0" kavramının nelere karşılık geldiğinden bahsediyorduk. İzleyicilerden de gelen fikirler bir araya getirildiğinde ortaya çıkan kavramlardan biri de "sitelerin içeriğini katılımcıların gayet kolayca belirleyebildiği, kolektif bilinç oluşturma" yapısı idi.

Bu durumun ve Web 2.0 dalgasının örneklerinden biri de Squidoo. Söz konusu taze sitenin sloganı Everyone's an expert on something (herkesin uzman olduğu bir konu vardır). Görülen o ki yakında Lens ve Lens Master kavramlarını daha sık duyacağız ve belki birileri Lens Master olarak para kazanmaya başlayacak...

Google bu kadar mı taciz edilir! :(

FZ

Geçen hafta bir dostumun ağabeyinin yüksek lisans tezini Internet´e yerleştirmiş ve burada haberini geçmiştim (http://www.fazlamesai.net/modules.php?name=News&file=article&sid=2349). Sonra da arkadaşımın sorması üzerine ona açıklama yapmıştım Google anında yakalar bu yeni belgeyi, PDF´nin de içini açar okur, indeksler filan. Birkaç gün önce Google´a baktığımda ve "veri zarflama" anahtar sözcüklerini arattığımda gerçekten de ilk sayfada ilgili tezin ve bağlantılı linklerin geldiğini gördüm. Arkadaşıma da söyledim, sevindi filan. Ancak bugün baktığımda beni dumura uğratan bir durumla karşılaştım!

Last.fm Kullanıcı bilgilerini CBS, RIAA'ya mı gönderdi?

fsniper

Tech Crunch, last.fm'in kullanıcı bilgilerini RIAA e ulaştırdığına dair bir haberin arkasını araştırmış. Özetle, kısa bir süre önce ismi gizli bir last.fm çalışanı, saklanmakta olan kullanıcı bilgilerin (kullanıcı adı, ip adresi, dinleme tercihleri gibi) RIAA'e aktarıldığı yönünde bir haber sızdırmıştı. Daha sonra last.fm bu konuda, "kendilerinin böyle bir bilgi aktarımı yapmadığını" söyleyerek haberi yalanlamıştı.

Ancak TechCrunch işin peşini bırakmayarak konunun last.fm in ebeveyn şirketi olan CBS tarafından yapıldığını haber yaptı. Habere bu bağlantıdan ulaşabilirsiniz.