Владимиров: Папа Карло

Формулировка

Дети, обнаружив на кухне коробку с пиццей:
- Почему у нас есть пицца?
синтаксис в мешке не утаишь
"why are we having pizza..."
Взрослеют, взрослеют... Еще немного, и дойдут до "почему есть пицца?" :)

Это мы сразу сообразили переформулировать: Почему Бог дал людям пиццу?
По-моему, очень логично. Повествовательная форма, описывающая тот же факт (обнаружение коробки с пиццей) вполне может звучать так: "у нас есть пицца." Теперь, допустим, есть некий факт X. Когда хочется узнать причину X, мы спрашиваем "почему X?". Для нашего примера получается "почему {у нас есть пицца}?".

Мне, наоборот, очень нравится как дети обращаются с языком, когда делают подобные вещи, они оперируют с куда более чистыми абстракциями, что даёт комбинаторные свободы и чёткость выражения мыслей. Потом они узнают про языковые уродства, и учатся "как правильно", с неохотой запоминая кучу нелогичных исключений, и ограничивая свою свободу выражения. Потом лингвистические уродства проникают настолько глубоко в сознание, что воспринимаются нормой и мы недоумеваем или даже посмеиваемся над комбинаторными произведениями ещё не испорченного детского ума.
Это семантика, а не уродство, интересная вещь. Дети генерируют комбинаторное количество синтаксически корректных, но семантически запрещенных конструкций, а без них и в голову бы не пришло.
Семантика языка *очень* уродлива/нелогична. Как вам, например, вопиющий факт того, что текст принципиально структурный (дерево), но позволяется только такая структура, которая более-менее взаимно однозначно отображается на список, в котором основной элемент, сохраняющий структуру это "запятая". Запятая, а не скобки! Т.е. сразу же запрещаются произвольной вложенности произвольные деревья. Причём даже для тех, которые отображаются, линейная форма очень далека от строгого взаимнооднозначного соответствия, чтобы воссоздать исходное дерево.

Ну и ещё: порядок слов, разных частей речи, тоже используется для сохранения структуры. Для любого формального языка никому в голову не придёт так делать. Структура отдельно, лексемы с их семантикой отдельно. Нет, мы в естественном языке сделаем винегрет!


Edited at 2013-05-12 07:58 pm (UTC)
Мне как раз очень нравится, что естественный язык немашинночитаем
и негенерируем. Люди - это люди, а компьютеры - это компьтеры.
Ну, это, безусловно, для нас, людей, укрепляет "job security" ;)