LSI, “Latent Semantic Indexing” (Gizil Anlamsal İndeksleme) anlamına gelir ve metin madenciliği ve bilgi geri alma (information retrieval) alanlarında kullanılan bir tekniktir. LSI, büyük metin koleksiyonlarını analiz ederek belgeler arasındaki semantik ilişkileri anlamak ve belgeleri daha iyi bir şekilde indekslemek için kullanılır.
LSI’nin temel amacı, belgelerin içeriklerini daha iyi anlayarak kullanıcının sorgularını daha iyi yanıtlayabilen bir bilgi geri alma sistemini geliştirmektir. Bu teknik, kelime bazlı bir indeksleme yerine kelimenin bağlamını da dikkate alarak çalışır. İki belge arasındaki benzerliği hesaplamak için kelime kullanımının ötesine geçer ve belgelerin gizli anlamsal yapısını yakalamaya çalışır.
LSI, belgeleri bir matematiksel uzayda temsil eder ve bu sayede benzer anlamlara sahip belgeler daha yakın konumlandırılır. Bu teknik, metin madenciliği, bilgi geri alma, belge sınıflandırma ve benzeri uygulamalarda kullanılır. Özellikle büyük metin koleksiyonlarını analiz etmek ve bu metinler arasındaki ilişkileri anlamak istendiğinde LSI önemli bir araç olabilir.