Hayatımızdaki Gizemli Yasa: Zipf Yasası

Zipf Yasası, Gizemli Olduğu Kadar Şaşırtıcı da…

İnsanlar konuşurken, yazarken, film çekerken, tiyatro yaparken farkında olmadan kullanmış olduğu kelimelerin sayısı, Zipf Yasası olarak bilinen bir yasaya uymaktadır.

Doğal dil işleme alanında kelimelerin kullanım sıklıkları, bir kelimenin taşıdığı anlam sayısı, kelimeler arası uzaklıklar gibi çok önemli unsurlar Dil Bilimci George K. Zipf (1902–1950) tarafından ortaya koyulan kanunlar temel alınarak belirlenmektedir.

Zipf, yaptığı araştırmalar sonucunda, bir kelimenin uzunluğunun, o kelimenin kullanım sıklığı ile yakından ilişkisi olduğunu fark etmiştir. Yani bir kelime ne kadar az harften oluşuyorsa kullanım sıklığı o kadar artıyor.

Zipf Yasası’na göre bir konuşmada ya da yazıda geçen kelimeler, azalan sıklığa göre sıralanırsa, bir kelimenin bu eserdeki geçiş adedinin bu sıralamadaki sırasına bölümü sabit bir sayı verir. Diğer bir deyişle: Hangi dil olursa olsun genelde ortalama olarak en sık kullanılan ikinci kelime en sık kullanılan kelimenin yarısı, üçüncü kelime 1/3, dördüncü kelime 1/4, beşinci kelime 1/5 dir.

Örneğin, Zipf, James Joyce’un Ulysses romanında:

10. en sık kullanılan kelimenin 2653 kere geçtiğini,

100. en sık kullanılan kelime tam bu sayının onda biri kadar yani 265,

200. en sık kullanılan kelime de bu sayının yarısı kadar, ilk sayının ise iki yüzde biri kadar, yani 133 kez tekrarlanmaktadır.

En sık kullanılan bininci kelime 26 kere,

10 bininci kelime 2 kere geçmektedir.

Tüm örnekler bu yasaya uymaya biliyor ama logoritmik grafiğe oturtulduğunda düz bir çizgi olması da şaşırtıcıdır.

Türkçede en sık kullanılan kelimeler ve kullanım oranları:

1.[bir] oran: % 3,348
2. [ ve ] oran: % 2,319
3. [ bu ] oran: % 1,353
4. [ de ] oran:   % 0,794
5. [ da ] oran:   % 0,757
6. [ için ] oran:  % 0,670
7. [ daha ] oran: % 0,524
8. [ ama ] oran:  % 0,520
9. [ o ]     oran:   % 0,515
10. [ gibi ] oran: % 0,496

Buradan ortaya şu çıkıyor ki tüm kelimelerin en sık kullanılan %20’lik kesimi günlük ihtiyacımızın %80’ini karşılıyor. (Pareto Analizi.)

Nasıl oluyor da dil, şehir nüfusu, ya da yemek tariflerindeki malzemeler gibi birbiri ile alakasız karmaşık yapılar Zipf Yasası’na uymaktadır? Konuşmak, yazışmak, yemek yapmak, bir yere göç etmek gibi eylemlerimiz nasıl oluyor da büyük resimde anlamlı bir denklemi takip etmektedir? Ne yazık ki bu soruların herkesçe kabul edilmiş bir cevabı mevcut değil.

Son söz: Yazarlar, yazmakta olanlar, yazmaya niyetlenenler Zipf Yasası’nın kuralları, yazacağınız metin içindeki kullandığınız kelimelerin çeşitlendirilmesinin önemini size anlatmaktadır.

Kolay gelsin…

Oktay Valunya

 

 

 

 

 

 

Önceki İçerikDünya Çocuk Kitapları Haftası Kutlu Olsun
Sonraki İçerikBursa’da Bienal Heyecanı Devam Ediyor