Обговорення користувача:Rar/Аналізатор тексту в RarBot-і (20.11.2010—20.11.2010)

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку
Повний архів: Обговорення_користувача:Rar/АвтоАрхів
Обговорення: Обговорення_користувача:Rar

Аналізатор тексту в RarBot-і

[ред. код]

Я теж вирішив написати бота (щоправда тількичитаючого, і такого що трохи автоматизує переклад (надоїло для кожного посилання три рази клацати перевіряючи інтервікі)). Детальніше тут. Зараз дойшов до етапу лексичного аналізу. Задача стоїть в тому, щоб виявляти елементи розмітки які треба пропускати в перекладену статтю без змін, і класифікувати текст що знаходиться між тими елементами розмітки за функціями (посилання, текст посилання, заголовок, назва шаблону, поля шаблону (я так розумію для шаблонів буде мало лексичного аналізу, і автоматизувати переклад там буде цікавіше)), щоб можна було виявляти елементи, переклад яких ми знаємо точно (посилання на статті, частовживані заголовки)...

Тому, чи не могли б ви показати код, який у вас аналізує текст статтей, і можливо дати деякі пояснення? --Bunyk 15:30, 20 листопада 2010 (UTC)Відповісти

Відповів мейлом.--Rar 19:54, 20 листопада 2010 (UTC)Відповісти