«Спаривание» глаголов
Эта задача была опубликована на сайте Яндекса в качестве тестового задания на вакансию
с интригующим названием "программист-лингвист":
Имеется русский морфологический словарь объемом ~100 тыс. входов,
в котором глаголы совершенного и несовершенного вида помещены в отдельные статьи
(т.е. /делать/ и /сделать/ считаются разными словарными входами).
Требуется найти в словаре такие видовые пары и "склеить" статьи в одну.
Замечательно! Задача как раз по мне. Давно хотел разобраться с тонкостями
внутриглагольного словообразования, просто до сих пор не было практической задачи,
ради которой стоило бы это делать. Итак, приступим.
Во-первых, нам нужен морфологический словарь. Это не проблема. Электронные копии
"Грамматического словаря русского языка" А.А. Зализняка лежат в интернете на каждом углу.
Берём, например, с сайта С.А. Старостина: http://starling.rinet.ru/downl.php?lan=ru.
Кстати, в этом словаре уже есть информация о видовых парах: для многих глаголов есть
ссылка на глагол противоположного вида. Но мы пока не будем подглядывать в ответ.
Понятие видовой пары
Во-вторых, хорошо бы определиться с тем, что же мы ищем, т.е. что такое видовая пара.
Это как раз самое интересное, т.к. этот вопрос является предметом споров среди лингвистов
уже сотни лет.
Мне близка точка зрения, изложенная в статье
А.А. Зализняк, А.Д. Шмелев. Типы видовой связи
В ней предлагается следующий критерий парности:
"Глагол сов. и несов. вида вступают в видовую связь,
если глагол сов. вида обозначает то же событие, что и глагол несов. вида
в ситуации обязательной имперфективации."
Всё понятно, кроме "ситуация обязательной имперфективации". Что это значит?
Это совсем просто. Поясню на примере из жизни.
Однажды на общем собрании мой начальник как всегда долго и нудно объяснял всем последствия
очередного переноса сроков выпуска проекта. В какой-то момент нервы у него не выдержали и
он выдал: "Я спрашиваю, сколько можно отсрачивать проект?!" Через пару секунд услышал сам себя,
побагровел и попытался замять конфуз: "Ну, я не это хотел сказать..." Но эффект был уже
достигнут: атмосфера на собрании значительно разрядилась.
Так почему же начальнику пришлось употребить столь пикантную форму глагола отсрочить?
Просто сама ситуация (повторяющиеся отсрочки) спровоцировала выбор языковой конструкции
("сколько можно..."), которая требует после себя глагола несовершенного вида.
Это и называется ситуацией обязательной имперфективации - когда грамматический контекст
требует от нас употребления глагола несовершенного вида.
Как это поможет нам выявить видовые пары? Возьмём пример, известный со школы:
делать – сделать. Проверим, что это видовая пара.
Подберём какой-нибудь пример со словом сделать, скажем, сделать вид и
подставим его после фразы "сколько можно...". Получилось: сколько можно делать вид?
Сделать превратилось в делать, значит, они – видовая пара.
Проверим пару рвать – сорвать. Пример: сорвать урок – сколько можно...
Нет, рвать уроки не подходит, правильно: срывать уроки. Значит, парой для
сорвать будет срывать, а не рвать, по крайней мере в значении
"саботировать". В то же время сорвать цветок и рвать цветы – вполне себе
видовая пара. То есть пара глаголов может вступать в видовую связь не во всех значениях.
Конечно, фраза "сколько можно" – далеко не единственный пример ситуации обязательной имперфективации.
Предположим, вы раскрываете газету и читаете начало статьи: "Вчера после обеда дворник Сидоров А.П.
вышел из подъезда и увидел слона." Та же ситуация в пересказе самого Сидорова А.П. могла бы звучать так:
"Представляете, выхожу вчера из подъезда и вижу – кого бы вы думали? – слона!"
В словах дворника рассказ о прошлом передаётся настоящим временем ("выхожу, вижу...")
Этот приём позволяет как бы приблизить описываемую ситуацию к настоящему,
заставить слушателей больше сопереживать ей. А с грамматической точки зрения он требует
обязательной имперфективации.
Вышел и увидел (в газетной статье) - это прошедшее время от выйти и увидеть,
которые в прямой речи превратились в выхожу и вижу – от выходить и видеть.
Таким образом, налицо пары: выйти – выходить и увидеть – видеть.
| Газета | Дворник |
Исходная форма | вышел, увидел | выхожу, вижу |
Инфинитив | выйти, увидеть | выходить, видеть |
Особенности видового словообразования
Итак, как же вся эта теория поможет нам составить в пары 100 тысяч глаголов?
Ведь не будем же мы просматривать их все и у каждого спрашивать "сколько можно?"
К счастью, основные закономерности внутриглагольного словообразования давно изучены
и описаны:
В. В. Виноградов "Грамматика русского языка"
Глава VII, §5 Способы внутриглагольного суффиксального формообразования и словообразования
И вот ещё одна очень интересная статья:
Федорова С.Д. Развитие глагольного корневого чередования о-а в современном русском языке
Пересказывать вышеназванные источники я не буду, отмечу лишь отдельные особенности
образования видовых пар, выявленные в ходе работы над программой.
Гнать, держать, смотреть и видеть...
Из приставочных глаголов на -еть только 5 корней образуют несовершенный вид
с суффиксом -ива- – это -смотреть, -глядеть, -сидеть, -свистеть и -вертеть:
- провертеть - проверчивать
- провертеть - провёртывать
- проглядеть - проглядывать
- просвистеть - просвистывать
- просидеть - просиживать
- просмотреть - просматривать
Что характерно, все они – исключения из второго спряжения:
Гнать, держать, смотреть и видеть,
дышать, слышать, ненавидеть,
и обидеть, и терпеть,
и зависеть, и вертеть.
Сидеть – такое же исключение, но в школьном списке не оказался просто потому, что окончание у него ударное и поэтому никаких сомнений не вызывает (сидит, сидят), в отличие, скажем, от гнать – гонит или гонет? гонят или гонют?
И сюда же:
- разболеться - разбаливаться
Присесть – присаживаться
Интересно образуют пары глаголы на –сесть:
- насесть – наседать
- осесть – оседать
- усесть – уседать
- присесть – присаживаться (не приседать)
- просесть – проседать (и, наверное, просаживаться)
- засесть – засаживаться (не заседать и не засиживаться)
- подсесть – подсаживаться
- усесться – усаживаться
- пересесть – пересаживаться
Т.е. глаголы, означающие переход в сидячее положение, образуют пары по модели
-сесть – -саживаться, а остальные на -седать.
Поэтому чувствуется просторечная игра слов во фразе «Как с утра засели, так и заседают»
– засесть и заседать объединены в ней, как будто бы они были видовой парой, хотя на самом деле означают разное.
Программа
Входом для программы является список глаголов с указанием положения ударения и вида (input.txt),
сформированный на основе словаря Зализняка:
аплодировать 6 нсв
арестовать 8 св
арестовывать 6 нсв
арканить 4 нсв
артачиться 4 нсв
...
На выходе получаем список пар "сов. – несов." (output.txt):
ахнуть - ахать
бабахнуть - бабахать
бабахнуться - бабахаться
благословить - благословлять
благоустроить - благоустраивать
благоустроиться - благоустраиваться
вбежать - вбегать
вбить - вбивать
ввезти - ввозить
ввести - вводить
...