
Doğal Dil İşleme ve Düşünen Bilgisayarlar Üstüne
Hocam, yapay zekânın hangi alanlarında, ne kadar süredir çalışıyorsunuz?
Doktora zamanından beri yapay zekâ (YZ) ile ilgileniyorum. Doktora konum, İngilizcesi “Qualitative Reasoning” olan ve “Nitel Uslamlama” olarak Türkçeye çevirebileceÄŸimiz konu idi, ne olduÄŸunu birazdan açıklayacağım. Demek ki, iÅŸte 1980′lerin sonlarından bu yana YZ ile ilgileniyormuÅŸum. Ayrıca yukarıda bahsi geçen konuya ek olarak DoÄŸal Dil İşleme özellikle Türkçe dil iÅŸleme ile bir süredir ilgileniyorum. YZ konusunda ilgilendiÄŸim temel iki alan bu ikisi.
Nitel uslamlama bilgisayarların daha iyi denklem çözebilmeleri, hakkında eksik bilgiye sahip olduÄŸumuz yani bütün katsayılarının deÄŸerlerini, bütün fonksiyonlarının kesin biçimlerini bilmediÄŸimiz, hakkında sadece kabaca bilgiye sahip olduÄŸumuz denklemleri çözmek için insanların bazen kullandığı “kısa yolları” kullanarak mevcut matematik denklem çözücü programlardan daha iyi bir ÅŸekilde çözüm yapmalarına elverecek algoritmaların geliÅŸtirilmesi ile ilgili bir ÅŸey. Ben bu konunun daha çok teorik yönleri ile ilgilendim yani bu konuda geliÅŸtirilmiÅŸ birkaç önemli yaklaşım, birkaç algoritma vardı, ben onları matematiksel olarak inceleyerek çeÅŸitli eksikliklerini buldum. Son olarak da Levent Akın arkadaşımızla birlikte onlardan bir tanesinin epey temel yani hiçbir ÅŸekilde giderilemeyecek bir eksikliÄŸini tespit ettik; matematiksel deyimi ile bir tür “eksiklik teoremi” ispatladık bu konu ile ilgili.
Türkçe doğal dil işleme konusuna gelince, bizim bilgisayar mühendisliği bölümünde uzunca bir süredir bu konu ile ilgili çalışmalar yapılıyor. Türkiye´de bu konudaki araştırmaları başlatan ilk bölümlerden biri. YZnin bu alanında yaptıklarımı özetlemem gerekirse: ALİ (Aritmetik Lisan İşleyici) diye bir program geliştirdim, Türkçe yazılmış aritmetik problemlerinin çözümlerini hesaplayıp cevabı da yine Türkçe olarak veren yani aritmetik açısından değil ama Türkçe dil işleme açısından bir katkı yaptık. Daha sonra bazı yüksek lisans öğrencilerimle birlikte TOY (Türkçe Okur Yazar) adını verdiğimiz, yine bilgisayarın insanla olabildiğince az kısıtlı bir Türkçe alt kümesi kullanarak doğal dilde iletişim kurabilmesine, sorular sorup sorulan soruları cevaplayabilmesine elveren bir altyapı geliştirdik. Bu doğrultuda sistemler geliştirmeye ve daha iyi performans sağlamaya yönelik çalışmalarımız devam ediyor, bunlar birbirlerini takip ederek, zincirlenerek bir bütün teşkil etmeye başladı.
Son olarak da birkaç aydan beri Türkçe ile ilgili olarak, cep telefonları üzerinden gönderilen kısa mesajlardaki sık rastlanan Türkçe hatalarını anlayıp – servis operatörleri kısa mesajları bilgisayar programları aracılığı ile iÅŸliyorlar, burada bir sorun olunca iÅŸ uzayabiliyor, hata mesajları gidiyor falan – bunları istatistiksel yöntemlerle tespti edip servis operatörünün bu hata giderme sürecini otomatik olarak ve çok daha kısa sürede çözmesine yardımcı olacak bir istatistiksel doÄŸal iÅŸleme yaklaşımı çalışması gerçekleÅŸtiriyoruz.
Doğal Dil İşleme konusunda dünyada ve Türkiye´deki çalışmalardan kıyaslamalı olarak bahsedebilir misiniz, hangi noktadan başlandı ve nereye varıldı? Hangi başarılar elde edildi?
YZnin ilk çıkışı ile birlikte insanların ilk aklına gelen doÄŸal dili insanlar kadar iyi kullanabilen bilgisayarlar üretebilmekti. Bu hedef olacak bir ÅŸeye benziyordu ilk zamanlarda çünkü tam o dönemlerde Noam Chomsky´nin meÅŸhur gramer kuramı piyasaya çıkmış. Yani ilk bakışta, dilin kuralları bilgisayar bir program gibi yazılıp ondan sonra da bilgisayarın bülbül gibi ÅŸakıyacağı var sayılıyor falan… fakat bu çok derin bir konu, bunun bu kadar kolay olmadığı kısa zamanda anlaşılıyor. Vaktiyle, herhalde o sırada ABD´nin hükümet kaynaklarından araÅŸtırma fonu alabilmek için en iyi yollardan biri Rusça – İngilizce otomatik çeviri yapmak olduÄŸu için o konuda çok fazla iddialı birtakım projeler ABD hükümet kurumlarına sunuluyor, onlar fonları veriyorlar, aradan bir süre geçtikten sonra bir arpa boyu bile yol alınmadığı anlaşılıyor o yüzden özellikle makine çevirisi alanında çok olumsuz bir raporun da yayınlamasının ardından epey bir süre fonlar bir hayli azalıyor; ilk baÅŸta sanıldığı kadar bilgisayara doÄŸal dili bütün zenginliÄŸiyle, bütün esnekliÄŸiyle yani gerçek hayatta insanların arasında geçen bütün cümlelerin anlaşılabileceÄŸi ÅŸekilde öğretmenin öyle de kolay bir ÅŸey olmadığı anlaşılıyor.
Yukarıdaki sebeplerden ötürü bu kesin formel yaklaşımlarım muhakkak başka yaklaşımlarla desteklenmesi gerekiyor, sözgelimi istatistiğin, örüntü tanımanın, insanlar kendi kafalarının içinde bu işi nasıl yapıyorlarsa işte o yöntemlerin devereye girmesi gerektiği anlaşılıyor. Halen de çok değişik açılardan bu konu işlenmeye devam ediyor. Şu anda senin benim gibi doğal dil kullanabilen bir bilgisayar meydanda yok. Muhakkak senin de bildiğin gibi konular kısıtlanıyor, mesela sadece hava raporları konusunda konuşan bir bilgisayar, sadece belli bir konuda denilen cümleleri anlayağı var sayılan bir bilgisayar ya da bizim ALİ örneğinde yaptığımız gibi üç beş tane belli sözdizimi örüntüsüne (syntax pattern) cümleler için doğru dürüst çalışan ötekilerde hiçbir şey yapamayan, bu şekilde dil kısıtlı programlar, mevcut durum bu.
Türkiye´deki çalışmaların tarihçesine gelince sanırım Hacettepe Üniversitesi´nde, 1970´li yıllarda bir doktora tezi yapılıyor Türkçenin morfolojisi ile ilgili ve böylece ilk temel atılıyor ama benim bir araştırmacı yaşına geldiğim zamanlarda bu iş paralel olarak Bilkent Üniversitesi´nde bilgisayarlı dilbilimden çok iyi anlayan Kemal Oflazer, Orta Doğu Teknik Üniversitesi´nde Cem Bozşahin ve bizim bölümde de Türkçenin morfolojisi ile ilgilenen Selahattin Kuru, Tunga Güngör ve Levent Akın öncülüğünde başlıyor. Yani bu ekip 1990´ların hemen başında Türkçe dil işleme konusunu canlandırdı. Şu anda da yine başka üniversitelerimizde de çalışmalar olmakla beraber esasen yine Sabancı Üniversitesi´nde çalışmalarına devam eden Kemal Oflazer, ODTÜ´de Cem Bozşahin´le çevresi ve bizde de Tunga Güngör ile ben varız bildiğim kadarı ile
YZ ve doÄŸal dil iÅŸleme ilgili olarak bir de iÅŸin popüler kısmı var; sözgelimi Loebner yarışması ve bu yarışmada ödül kazanan ALICE, Jabberwocky gibi yazılımlar, popüler “chatbot”lar, AIML gibi diller, vs. Bunlarla ilgili görüşleriniz nedir, sizce bunlar birer YZ uygulaması olarak nitelendirilebilir mi?
Bu Loebner´in yarışması düzgün bir ÅŸekilde yani hakikaten insanların dili anladığı ve hakikaten insanların dili iÅŸlediÄŸi ÅŸekilde bilgisayarları kurmaksa… Åžu anda bunu nasıl yapabileceÄŸimizi bilmiyoruz ama bunun çok zor olduÄŸunu yani bu sıralarda, önümüzdeki birkaç yıl içinde pek yapamayacağımızı biliyoruz. Ama Loebner yarışması gibi halihazırda mevcut en iyi yanıltma performansına sahip bilgisayar programını ararsanız aslında bu Turing testinin içinde de o sorun var; kazanmak için yanıltıcı olmak gerekiyor. Yanıltıcı olmak için de, Loebner yarışmasının ÅŸimdiki halinin gösterdiÄŸi gibi, en iyi yöntem hakikaten bu iÅŸi insanlar gibi yapıp yapabildiÄŸimiz kadarını yapalım, teorik olarak saÄŸlam, düzgün bir programımız olsun deÄŸil, iÅŸte yani insanların yanılma ile ilgili zayıflıklarını kullanarak, onları psikolojik olarak yönlendirerek, bir tür göz boyama oyunu yapalım. Yani bizim programımızın içi hakikaten hiçbir ÅŸeye benzemesin yani “anlama” olarak nitelendirebilecek hiçbir süreç programın içinde olmasın ama büyük bir veritabanından yararlanarak girilen sorulara çok basit örüntü iÅŸleme teknikleri ile en uygun olduÄŸunu tahmin ettÄŸimiz cevabı doÄŸrudan ekrana göndererek birkaç dakika için bir illüzyon ortamı yaratalım. İzleyebildiÄŸim kadarı ile bu yarışmayı kazanan programlar bu nedenle çok eÄŸlendirici oluyorlar ama içlerine baktığımızda bizim burada verdiÄŸimiz “Natural Language Processing” dersinde 5 dakikadan fazla vakit harcamamızı gerektiren herhangi bir ÅŸeyle karşılaÅŸmıyoruz. Yani bizim geliÅŸtirdiÄŸimiz ama o yarışmaya girse çok daha düşük puan alacak ama içi tahmin ettiÄŸimiz kadarı ile insanların beyninin içinde olup biten süreçlere çok daha benzeyen programlarımız var. YZ ve doÄŸal dil iÅŸleme konusunda çalışan araÅŸtırmacılar bu sebeplerden ötürü bu Loebner yarışmasını pek kayda deÄŸer bir ÅŸey olarak görmüyorlar.
YZdeki iki ana yaklaşım; yani sembolik mantık ile işleme ve dağıtık paralel işleme, yapay sinir ağları, vs. arasıdaki temel farklar nelerdir? Hangisini tercih ediyorsunuz ve neden? Biraz bunlardan bahsedebilir miyiz?
Bunlar arasındaki temel farklar; sembolik iÅŸlemenin, 1950´lerde bu YZ iÅŸleri yeni yeni baÅŸlarken bilinen bilgisayar mimarisine daha uygun olması yani 1950 model bir bilgisayar mühendisinin aklına ilk gelecek YZ yöntemi olması; dağıtık paralel iÅŸlemenin ise hem 1950´lerde hem de aslında ÅŸimdi yani masalarımızın üzerindeki bilgisayarların mimarisine benzemeyen ama insanların kafalarının içindeki mimariye çok benzeyen bir yöntem olması. Öyle görünüyor ki, insanlar, kafalarının içinde çok sayıda küçük, birbirlerine baÄŸlı ve bireysel olarak zayıf iÅŸlemci bulunduruyorlar ama o iÅŸlemcilerin birlikte çalışmasından daha üst seviyede sanki tek bir iÅŸlemciymiÅŸ izlenimini veren bir – teknik terimi ile – sanal makine üretiyorlar. O yüzden, sembolik yaklaşıma göre yazılmış bir program, insanın daha yüksek diyebileceÄŸimiz biliÅŸsel iÅŸlevlerini, mesela satranç oynama, daha iyi karşılıyor. Öte yandan daha “alt seviyeli” iÅŸleri de mesela görüntü tanıma, bu dağıtık çok sayıda iÅŸlemcinin birbirlerine baÄŸlanması mimarisiyle gerçekleÅŸtirilebilecek programlar karşılıyor. İnsan kafasının içinde bunun ikisi de var. Yani bir tane büyük iÅŸlemci yok ama o milyonlarca küçük iÅŸlemcinin oluÅŸturduÄŸu bir adet büyük sanal iÅŸlemci var ve sembolik yapay zekâ ile iyi olur dediÄŸimiz iÅŸleri insanlar o sanal büyük iÅŸlemci ile yapıyorlar.
Bunlardan hangisini tercih ettiÄŸime gelince, tabii ki bunlardan ikisini de tercih ederim. EÄŸitimimiz nedeniyle ki ÅŸu anda tüm dünyadaki bilgisayar eÄŸitimi böyle, tek iÅŸlemcili yapıyı öğrenciler daha önce öğreniyorlar, çok iÅŸlemcili yapı ise çok daha sonra, yaÅŸları ilerlemiÅŸken, yeniden öğrenmeleri gereken yeni bir ÅŸey olarak karşılarına çıkıyor. O yüzden çok iÅŸlemcili yapı, kafa karıştırıcı, garip bir yenilik gibi geliyor insanlara. Oysa öyle deÄŸil, anlattığım gibi ikisinin birden eÄŸitimin ilk başından itibaren birleÅŸik bir perspektif içinde anlatılması gerek. O zaman da hakikaten ÅŸimdiki YZ topluluÄŸunda özellikle yaÅŸlı araÅŸtırmacılar arasında olduÄŸu gibi “ben sembolcüyüm, nöron tanımam” veya “nöron mu, o da ne?” gibi yapay (!) ayrımlar çıkmaz ileride.
Araştırmalarınızda, somut projelerinizde kullandığınız yazılım araçları, programlama dilleri nelerdir? Neden bunları tercih ediyorsunuz?
Kendi adıma en baÅŸtan beri YZ ile ilgili iÅŸlerde Prolog dilini kullanıyorum. Neden Prolog da baÅŸka bir ÅŸey deÄŸil? Çünkü az önce de belirttiÄŸim ayrımın – neyse ki anlamlı olarak – sembol tarafındayım, yani hem nitel uslamlama hem de benim yaptığım doÄŸal dil iÅŸleme problemleri sembolik yaklaşımla daha kolay bir ÅŸekilde modellenebilip çözülebiliyor. Ancak tabii doÄŸal dil iÅŸleme, özellikle tam ölçekli doÄŸal dil iÅŸleme için doÄŸal dil anlama bilgisayarı yapılacaksa bunun sadece sembolik yaklaşımla olmayacağı artık yavaÅŸ yavaÅŸ anlaşılıyor ama dediÄŸim gibi ben de resmin hepsi üzerinde çalışmadım ÅŸimdiye kadar. Åžu ana kadarki çalışmalarımda da bu yüzden de Prolog kullandım ve zamanın en iyi Prolog sistemi hangisi ise onu kullandım.
Ancak bu konuşmayı okuyan arkadaşlar yanılmasınlar, ne kadar çok şey bilirlerse, alet çantalarında ne kadar çok aletleri olursa bu onlar adına o kadar iyi bir şey olur.
Biraz da teknoloji ve felsefe arakesitine bakalım. Bilgisayarlar ve bilinç… Tartışılan bir konu, ne kadar anlamlı? Bilinç sizce bizim uydurduÄŸumuz bir yapay bir kavram mı? Sizce her ÅŸey mekanik hale getirilebilir mi? Sizce nasıl bir çerçeve içinde YZ çalışmaları sürdürülmeli?
Bilinç… var olan bir ÅŸey. Yani bilincin var olmadığını söyleyemem herhalde çünkü ne kast ettiÄŸini, birisi bilinç dendiÄŸinde herkes üç aÅŸağı beÅŸ yukarı anlıyor. Ama “böyle bir ÅŸey var” demek bilimadamlarına yakışan bir ÅŸey deÄŸil, bunu söyleyip orada durmak yani. Bu “ÅŸey”in, bu olgunun nasıl olduÄŸunu, fiziksel açıklamasını bulmamız gerekiyor bütün detayıyla. BildiÄŸim kadarıyla binlerce yıl boyunca insanların kafasını çok kötü bir ÅŸekilde karıştıran ve doÄŸru dürüt bir çözüm bulamadıkları bu konuya, bilgisayarlar icad edileli beri artık insan beyninin içinde bilinci oluÅŸturan sürece ve yapıya çok benzeyen ve kendi yaptığımız fiziksel bir makina bulunduÄŸu için çok manalı cevaplar verilebilir hale geldi. Yani, çok basitçe söylemek gerekirse ki belki de bu kadar basitçe söylememek gerekir, benim bu konuyu özetleme tarzım insan beyninin temelde bir bilgisayar olduÄŸu ve de bizim bilinç dediÄŸimiz, algı dediÄŸimiz, duygu dediÄŸimiz biliÅŸsel süreçlerin herbiri için ne diyorsak bunların hepsinin bu bilgisayarın çalışması nedeni ile ortaya çıkan süreç ve olgular olduÄŸu yolunda. Bunu demek için iyi nedenlerim var ama kısaca söylemek için lafı çünkü diye uzatmıyorum, istersen “çünkü”süne de geçebiliriz…
İngiliz matematikçi ve fizikçi Sir Roger Penrose´un da bilinç, YZ, vs. üzerine yazdığı kitaplarda kuantum mekaniğine, kuantum bilgi işleme, beyindeki mikrotübüllerdeki kuantum seviyesindeki etkileşimlere dair görüşler mevcuttu. Son yıllardaki kuantum bilgiişlem teorisi ışığında bu konuda neler düşünüyorsunuz?
Kuantum bilgiiÅŸlem YZ ile doÄŸrudan ilgili deÄŸil, daha çok sıralama problemi, verilen büyük bir tamsayıyı çarpanlarına ayırma gibi normalde bilgisayar mühendisliÄŸinde YZ kapsamı altında deÄŸil baÅŸka -çok daha sıradan iÅŸler- kapsamında algılanan problemleri daha hızlı çözmek için odaklanmış bir yöntem ancak gerçekten de Penrose, insan beyninde kuantum fiziÄŸine has yani klasik Newton fiziÄŸine açıklanamayacak birtakım süreçlerin bilinç gibi olgulara sebep olduÄŸunu iddia ediyor. Kitaplarından anladığım kadarı ile hem insan beyninde bu klasik fizik deÄŸil de kuantum fiziÄŸine özgü iÅŸlerin hakikaten olup olmadığı, hem de eÄŸer oluyorsa bunun gerçekten bilinçle ilgili bir açıklama yapmak için elzem olup olmadığı bir tartışma konusu. Tabii o incelemeyi yapmadığım için ki bildiÄŸim kadarı ile henüz kimse de yapmadı, insan beyninde Penrose’un bahsettiÄŸi cinsten, safi kuantum yani klasik fizikle açıklanamayacak ÅŸeylerin olup olmadığını bilmiyoruz. Ama demin fazla detayına girmediÄŸim bilinç açıklaması yani “insanların kafaları bilgisayardır, baÅŸka tüm biliÅŸsel faaliyetleri de bu bilgisayarın çalışması sonucu ortaya çıkar” diye özetlediÄŸimiz ÅŸimdiki yerleÅŸik teori ekstra bir kuantum özelliÄŸine gereksinim duymadan bu iÅŸi anlatıyor. Yani ben doÄŸrusu ÅŸimdiki teorinin bir de kuantum fiziÄŸi öğrenmeyi gerektirmeden mevcut probleme cevap saÄŸladığı kanaatindeyim. Ama tabii iÅŸin içinde vazgeçilmez ÅŸekilde bu kuantum özelliklerinin de olduÄŸu ortaya kesin ÅŸekilde çıkarsa mecburen o detayları da öğrenip bunları en iyi ÅŸekilde teoriye eklemek zorunda oluruz.
Son olarak sizin eklemek istediğiniz bir şeyler var mı hocam?
YZ tabii çok çekici bir isim. AraÅŸtırma yapmak isteyen gençler ya da herhangi bir nedenden ötürü hem zekâyı, hem bilinci hem de bilgisayarları daha iyi öğrenmek isteyen insanların hemen ilgisini çeken bir terim. Åžu ana kadar genelde bütün mühendislik projelerinde olduÄŸu gibi baÅŸlarda oldukça nereye gideceÄŸimizi bilemeden, yanlışlar yaparak, hatalardan öğrenerek, iÅŸte yaklaşık bu alanın 50-55 yıllık geçmiÅŸinde çok enteresan geliÅŸmeler oldu ve halen de olmaya devam ediyor. Yani deminden beri dediÄŸim, “bu iÅŸin şöyle olduÄŸu anlaşıldı”, “bu iÅŸ bence böyledir” gibi eÄŸer kesin bir ÅŸeyler söylediysem, bilimin temel prensipleri çerçevesinde onlarda da yarın aniden onun öyle olmadığını gösteren bir geliÅŸme olabilir ama zaten dediÄŸim gibi bu bilimin cilvesidir. Bütün bunları göz önünde bulundurduÄŸumuzda genç araÅŸtırmacılara YZ alanını tavsiye ederim.
Bu röportaj İleriseviye.org sitesinde yayınlanmıştır. Tüm hakları İleriseviye.org sitesine aittir.
Emre Sevinç → 30 06 2009
0