|
|
|
|
Türkçe Sözcük kökü bulma ve üretme programlarımız arama motorları tarafafından Türkçe metinleri aramakta kullanılabilinir. Türkçe Sözcük Kökü BulmaGeliştirdiğimiz Türkçe Sözcük Kökü Bulma Programı, Microsoft tarafından geliştirilmiş IWordBreaker Arayüzü ile uyumludur. Bu program verilen bir metindeki Unicode karakterlerini sözcüklere böler. Bu program Microsoft Windows 2000 ve Windows XP bulunan endekleme programı ile uyumludur. Başka endeksleme programları tarafından da lisanslanabilir. Programımız üç değişik durumda kullanılabilinir.
Turkish Yeni Sözcük ÜretimiGeliştirdiğimiz Yeni Sözcük Üretimi Programı, Microsoft tatafından geliştirilmiş IStemmer Arayüzü ile uyumludur. Bu program verilen bir sözcüğe benzeyen ve ondan dilbilgisi kurallarına uygun olarak üretilebilecek sözcükleri bulur. Arama motorları bu programı kullanarak kullanıcının aradığı sözcüğe benzer sözcükleri de bulduklarından daha doğru neticeler elde ederler. Mesela, bu program olmadan kullanıcı "Ahmet resim" aratırsa, arama motorları sadece bu sözcüklerin kök hallerini içeren metinleri bulabilirler. Bu program sayesinde "Ahmet'in resimleri" sözcüklerini içeren metinler de bulunabilir. Bunun nedeni bizim programlarımız "Ahmet'in" "Ahmet" sözcüğünden üreyebileceğini ve "resimleri" sözcüğünün "resim" sözcüğünden üreyebileceğini arama motoruna IWordBreaker ve IStemmer Arayüzü ile bidirir. Bu program Microsoft Windows 2000 ve Windows XP bulunan endekleme programı ile uyumludur. Başka endeksleme programları ve arama motorları tarafından da lisanslanabilir. This tool can be also licensed by search engines to help in finding all documents that contain words derived or similar to a specific set of query words. For example, without our stemmer searching for "Ahmet resim" (Ahmet picture) in a set of documents will return all document that contain these words in the base forms. However, if a document contains the words "Ahmet'in resimleri" (pictures of Ahmet), the search engine would not be able to locate this document because the query text did not match the form used in the document. A search engine using our tool will intelligently identify this document as well as "Ahmet'in" can be grammatically derived from "Ahmet" and "resimleri" can be derived from "resim." Programımız üç değişik durumda kullanılabilinir.
Türkçe gürültü sözcükleriBazı sözcükler metinlerde o kadar çok kullanılırlar ki, onları endekslemek performansı çok düsürür. Endeksleme motorları bu listedeki sözcükleri elimine edebilirler. |
__________________________
|