У меня есть примерно 10000 текстовых отрывков примерно по 100 - 300 слов.
Задача составить таблицу точных повторений более, чем по 8 слов подряд.
То есть надо узнать, нет ли одинаковых словесных цепочек в этих 10000 отрывков, а если есть,
то запомнить где.