Лемматизация (MyStem), группировка без учёта порядка слов. Эталон по умолчанию — первая фраза в группе; при ручной частотности — фраза с максимальной частотой (ТЗ). Стоп-слова не учитываются.
Пустые строки игнорируются. API: POST /api/v1/deduplicate с полями canonicalMode, frequencies.
| # | Исходная фраза | Частота | Леммы | Эталон |
|---|