Ukrainian
Summary:Четвертий том «Корпусна та когнітивна лінгвістика» п’ятитомної монографії «Лінгвістично-інформаційні студії» присвячено викладу теоретичних і технологічних засад корпусної лінгвістики. Особливу увагу приділено розробленню Українського національного лінгвістичного корпусу (УНЛК) та його численним застосуванням у проведенні різноманітних лінгвістичних і когнітологічних досліджень та укладанні лексикографічних праць, насамперед академічного Словника української мови в 20 томах. Погляд на лінгвістичний корпус (ЛК) як на велику колекцію інформаційно і лінгвістично анотованих масивів природномовних текстів спонукає до розроблення структури та архітектури цих лінгвоінформаційних систем, методів ідентифікації, стандартизації та експлікації (маркування) їх структурних елементів. У цьому зв’язку окреслено роль спеціальних мов маркування (SGML, HTML, XML etc.) і різноманітних форматів подання бібліографічної та лінгвістичної інформації в технологіях побудови ЛК.Розглянуто лінгвістичні та системотехнічні засади побудови УНЛК та його основних структурних підсистем: бібліографічної та лінгвістичної, які забезпечують індексування об’єктів зберігання, створення, редагування та оперування повнотекстовим індексом, забезпечення бібліографічного і повнотекстового багатокритеріального пошуку, статистичні та сервісні функції маніпулювання корпусними даними. Значну увагу приділено лінгвістичним дослідженням, проведеним у Фонді на матеріалі УНЛК: вивченню різних типів омонімії лексичної системи української мови, функціонуванню прийменникових конструкцій в українських текстах, одержанню статистичних параметрів та визначенню ступеня фонетичності писемного варіанту української мови. Отримані результати мають велике значення для розроблення цифрових систем опрацювання природної мови (орфокоректори, системи семантичної інтерпретації, лінгвістичної концептографії та машинного перекладу, аналізатори та озвучувачі текстів та ін.).Окремий розділ присвячено застосуванню корпусних технологій у сфері теорії, та технології проведення різного роду лінгвістичних експертиз природномовних текстів.