WWW.KONF.X-PDF.RU
БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА - Авторефераты, диссертации, конференции
 


Pages:     | 1 | 2 || 4 | 5 |   ...   | 14 |

«МАТЕРИАЛЫ Третьей Международной научно-практической конференции «Социальный компьютинг: основы, технологии развития, социально-гуманитарные эффекты» (ISC-14) Сборник статей и тезисов ...»

-- [ Страница 3 ] --

Организованный таким образом электронный ресурс планируется разместить в свободном доступе в Интернете, что позволит использовать его в качестве материальной базой для типологических исследований лексики, работ по теоретической лексической семантике, когнитивно-ориентированных и ареально-типологических исследований, а также в прикладных задачах автоматической обработки языка. В настоящий момент ведётся разработка поискового интерфейса словаря.

Теоретические основания проекта Основной частью целевой аудитории разрабатываемого онлайн-ресурса являются исследователи, специализирующиеся в области лексической типологии и теоретической лексикологии.

В свете этого, при реализации проекта используется современная методология описания лексики, принятая в данных подходах. При описании семантики лексем мы следуем методологии семантических полей и синонимических рядов, разработанной в исследованиях Московской семантической школы ([1, 2]). Работа с семантическими полями проводится для достижения эффективности описания лексем: параметры, составляющие ядро значения лексемы L1, наиболее четко выявляются при ее сопоставлении с лексемами L2…Ln синонимического ряда, в который входит L1, а также при учете лексем, входящих в гипо-/гиперонимические отношения с L1. Таким образом, при Социальный компьютинг: Основы, Технологии развития, Социально-гуманитарные эффекты (ISc-14)»

описании лексемы мы анализируем её парадигматические связи в лексике языка. В русле данного направления, в значении лексемы выделяются существенные признаки описываемой реалии – «константы» (без таких признаков данная реалия перестанет называться своим именем), после чего выделяются признаки-«переменные». Например, при описании русской лексемы «овраг» константой будет являться компонент значения «углубление, впадина», т. е. нечто ниже равнины, как правило, «длинное, вытянутое», «достаточно большого размера»; для выяснения «переменных» можно установить, например, в результате чего обычно образуется овраг, что в нём растет, какую форму он может иметь (прямой или извилистый) и т. п.

Второй важный метод, который применяется в ходе работы, разработан в рамках корпусно-ориентированных исследований языка (см. [6] и [7]).

Указанный подход, заключающийся в комплексном обследовании массивов текстов на языке и обсчёте полученных данных, позволяет уточнить семантику лексем, которую достаточно сложно выявить при непосредственной работе с информантом (в первую очередь это касается частиц, междометий и т. п.). Несмотря на то, что, например, для английского языка корпусный подход к лексикографии применяется как минимум с 1980-х гг.

(см., напр., [8]), в России он использовался только при составлении словарей русского языка, но не других языков России. Коллектив располагает корпусом текстов на бесермянском диалекте объёмом около 75000 словоупотреблений (большая часть корпуса хранится в формате Fieldworks и имеет грамматическую аннотацию), который в настоящее время активно расширяется и дополняется. При разработке онлайн-интерфейса планируется встроить возможность использования корпусных данных: примеры употребления лексемы в корпусе, а также корпусные данные о её частотности и сочетаемости.

Методы полевой работы При выявлении и уточнении значения лексем необходимо взаимодейМГГУ им. М.А. Шолохова www.mggu-sh.ru ствие с носителями языка, т. е. полевая работа. Для эффективности полевой работы применяется разработанный коллективом метод опроса информантов, состоящий в следующем. Для каждого лексического входа создается список возможных значений и особенностей употребления, который предстоит уточнить при работе с информантом. Данный список строится

1) на основе анализа употребления бесермянской лексемы в текстах; 2) на основе анализа значений соответствующей русской лексемы; 3) на основе анализа данных литературного удмуртского языка; 4) при обращении к методу констант и переменных в значении бесермянской лексемы; 5) при анализе парадигматических связей бесермянской лексемы (т.е. синонимов, согипонимов, гиперонимов). На основе составленного списка строятся диагностические контексты, в которых должны проявиться значения бесермянской лексемы, предполагаемые на основании пунктов 1)-5). На первом этапе опроса информанту предъявляются диагностические контексты на перевод. Если в некоторых контекстах он не употребляет изучаемую лексему, на втором этапе информант запрашивается о возможности ее употребления в этих контекстах. После опроса как минимум трех носителей по указанной процедуре делается вывод о наличии соответствующих значений. В случае если носители расходятся в своих суждениях, спорные моменты выясняются у бльшего количества носителей. При опросе обязательно фиксируется дата и идентификатор информанта.

Заключение. Настоящий проект объединяет методологические разработки, созданные в рамках теоретической лексической семантики, традиционной лексикографии, корпусно-ориентированного подхода к языку и современных методов представления информации, используемых при описании лексики. Коллектив использует собственную методологию лексикографической полевой работы, синтезирующую достижения всех перечисленных подходов. В ходе проекта с применением этой методологии была создана электронная словарная база объёмом около 4,5 тыс. входов. В наСоциальный компьютинг: Основы, Технологии развития, Социально-гуманитарные эффекты (ISc-14)»

стоящее время основными направлениями работы являются расширение и уточнение словарной базы и разработка онлайн-интерфейса словаря.

Литература

1. Апресян Ю.Д. Исследования по семантике и лексикографии. Т. I: Парадигматика. М.: Языки славянских культур, 2009

2. Апресян Ю.Д. Новый объяснительный словарь синонимов русского языка. М.: Языки славянских культур, 1999; 2000; 2003

3. Люкина Н. М. Особенности языка балезинских и юкаменских бесермян.

Дисс. на соиск. уч. ст. к. филол. н., Ижевск, 2008

4. Тепляшина Т.И. Язык бесермян. М., 19

5. Dziemianko, A. On the use(fulness) of paper and electronic dictionaries. //

S. Granger, M. Paquot (eds.): Electronic Lexicography, pp. 319-341. Oxford:

Oxford University Press, 2012

6. Facchinetti, R. Theoretical Description and Practical Applications of Linguistic Corpora. Verona: QuiEdit, 2007

7. Hanks, P. The impact of corpora on dictionaries. // P. Baker (ed.):

Contemporary Corpus Linguistics, pp. 214-236. London: Continuum, 2009

8. Sinclair, J. (ed.). Collins COBUILD English Language Dictionary. London:

HarperCollins Publishers, 1987 R.I. Idrisov, N.V. Serdobolskaya, M.N. Usacheva, T.A. Arkhangelskiy

CREATING A MULTIMEDIA LEXICOGRAPHIC RESOURCE

FOR THE BESERMAN DIALECT OF UDMURT LANGUAGE

Abstract. The talk presents an ongoing project aiming at building a multimedia lexicographic resource for the Beserman dialect of Udmurt МГГУ им. М.А. Шолохова www.mggu-sh.ru language. As a theoretical framework of our project, we employ the methods of semantic fields and semantic series developed in the works of the Moscow semantic school, and corpus approach to lexicography. In our fieldwork, we employ our own methods of lexicographic research and use dedicated dictionary compilation software. At the moment, our database comprises 4.5 thousand lexical entries. The resource will be made available online after the development of a web interface, now in progress, is finished.

Keywords: multimedia lexicographical resource Language Besermyan.

Idrisov Ruslan I. – idrisov.ru@gmail.com; The Institute of Linguistics, RAS, Moscow.

Serdobolskaya Natalia V. – PhD, serdobolskaya@gmail.com; Sholokhov Moscow State University for the humanities, Moscow.

Usacheva Maria V. – PhD, mashastroeva@gmail.com; Moscow State University, Moscow.

Arkhangelskiy Timofey A. – PhD, tarkhangelskiy@hse.ru; National Research University Higher School of Economics, Moscow.

–  –  –

ЛИНГВИСТИЧЕСКИЕ ЭВРИСТИКИ И СТАТИСТИЧЕСКИЕ МЕХАНИЗМЫ

ДЛЯ МОДЕЛИРОВАНИЯ СЕМАНТИКО-СИНТАКСИЧЕСКОГО

АНАЛИЗА В СИСТЕМАХ ОБРАБОТКИ ЗНАНИЙ

Аннотация. В работе рассматриваются задачи создания эффективных лингвистических процессоров, в которых сочетаются лингвистические правила и статистические модели для систем обработки текстовых знаний и машинного перевода.
Для верификации и уточнения правил формируются и используются текстовые корпуса, при этом для извлечения межъязыковых соответствий созданы механизмы выравнивания параллельных текстов. Приводятся статистические и эвристические модели выравнивания и перевода, задача анализа естественно-языкового текста также рассматривается как задача перевода на язык базы знаний. Предлагаются решения на основе гибридной грамматики, включающей лингвистические правила и вероятностные характеристики языковых структур.

Ключевые слова: статистические модели; обработка знаний, машинный перевод; параллельные тексты; выравнивание; лингвистические фильтры.

1. Введение. В последние годы все более отчетливой становится тенденция к созданию новых методов обработки текстовых знаний и построению моделей машинного перевода, в которых учтены сильные стороны как статистических моделей, так и подходов на основе лингвистических правил. Встречное движение к созданию гибридных моделей обработки * Козеренко Елена Борисовна, кандидат филологических наук, зав. лабораторией Компьютерной лингвистики и когнитивных технологий обработки текстов, kozerenko@mail.ru, Институт проблем информатики Российской академии наук.

МГГУ им. М.А. Шолохова www.mggu-sh.ru естественного языка идет как со стороны статистического машинного перевода, когда в чисто статистические модели встраиваются элементы грамматик, так и со стороны традиционных методов машинного перевода, в которых правила анализа и перевода дополняются статистическими данными. Эти данные учитываются при создании лингвистических процессоров, особенно для разрешения неоднозначности языковых объектов.

Истоки стохастической исследовательской парадигмы применительно к задачам обработки естественного языка находятся в проектах разработки алгоритмов распознавания речи, символов, исправления орфографии.

Основным методом решения многих задач, в частности определения и разметки частей речи, вероятностного грамматического разбора, является правило Байеса. В архитектуре стохастических систем в основном используется алгоритм динамического программирования.

На современном этапе развития исследований и разработок в области анализа естественного языка все больше назревает потребность в подходах, основанных на лингвистических знаниях. Это осознается и сторонниками статистических подходов. Например, в работе [1] описан двухступенчатый метод автоматического извлечения переводных шаблонов из параллельных текстов на английском и китайском языках. Этот метод основан на алгоритме индукции грамматики и алгоритме выравнивания с использованием скобочной трансдукционной грамматики. Однако сами авторы указывают, что, поскольку в данной модели не заложены предварительные синтаксические знания, грамматическая правильность результата не может быть гарантирована.

Основные подходы к статистическому машинному переводу, в которых используется синтаксис, различаются по тем синтаксическим теориям, которых они придерживаются, и системам аннотирования, построенным в соответствии с той или иной теорией.

Социальный компьютинг: Основы, Технологии развития, Социально-гуманитарные эффекты (ISc-14)»

2. Вероятностные методы грамматического разбора предложений. Статистические методы обработки естественного языка расширяют схему основных существующих подходов к машинному переводу – прямого перевода, переноса (трансфера) и подхода на основе языка-посредника (интерлингвы) [2,3].

Значения вероятностей для каждого возможного варианта грамматического разбора (т.е. развертывания нетерминального узла) вычисляются на основе частот встречаемости таких вариантов разбора в существующих текстовых корпусах с синтаксической разметкой (treebanks). Значения вероятностей для вариантов разбора могут быть также получены и в виде лингвистических экспертных оценок.

Для любой системы обработки естественного языка необходимо проектирование модуля определения и разметки частей речи (тэггера). Стохастические тэггеры появились в 1980-е годы. Их общая идея заключается в выборе наиболее вероятного тэга (т.е. частеречной метки) для данного слова. Чаще всего для вероятностных тэггеров используются марковские модели.

К примеру, для некоторого предложения или последовательности слов выбирается последовательность тэгов, которая максимизирует следующую формулу:

P(слово| тэг)*P(тэг|предыдущие n тэгов).

Еще один подход к машинному обучению, основанный на правилах и стохастическом тэггировании (разметке частей речи), известен как обучение, основанное на трансформациях (Transformation-Based Learning, TBL).

TBL – это метод управляемого обучения с использованием заранее размеченного обучающего корпуса.

Для вероятностного грамматического разбора применяются стохастические грамматики.

Вероятностная контекстно-свободная грамматика определяется в виде G = (N, T, P, S, D), где N – множество нетерминальных символов; T – множество МГГУ им. М.А. Шолохова www.mggu-sh.ru терминальных символов; P – множество продукций вида Ab, где A – это нетерминальный символ, а b – цепочка символов; S – специальный исходный символ; D – функция, приписывающая значения вероятности каждому правилу из множества P. Как получить необходимые данные для вероятностной контекстно-свободной грамматики? Один из путей – использование корпуса синтаксически размеченных предложений. Такой корпус называется банком синтаксических деревьев (treebank). Например, Penn Treebank [4] содержит деревья разбора для ряда текстовых корпусов (Brown Corpus, Switchboard

corpus). Если задан банк деревьев разбора, то вероятность каждой развертки некоторого нетерминального узла может быть вычислена путем подсчета частоты ее встречаемости с последующей нормализацией:

Вероятностная грамматика замещения деревьев является обобщением вероятностной контекстно-свободной грамматики, при этом более мощной стохастически, поскольку она дает возможность приписывать значения вероятности фрагментам или даже целым схемам разбора.

Рассмотрим, каким образом значения вероятности используются в процессе грамматического разбора. Например, вероятностная контекстно-свободная грамматика (PCFG – Probabilistic Context Free Grammar) и вероятностная грамматика замещения деревьев (PTSG – Probabilistic Tree Substitution Grammar) присваивают вероятность P каждому дереву разбора T (т.е. каждому деривату) предложения S. Эта информация является ключевой для разрешения неоднозначности синтаксических структур. Вероятность каждого возможного дерева разбора T определяется как произведение вероятностей всех правил r, используемых для развертывания каждого узла n в дереве разбора.

Социальный компьютинг: Основы, Технологии развития, Социально-гуманитарные эффекты (ISc-14)»

Вероятность однозначного предложения (т.е. предложения, где не требуется разрешать неоднозначность) равна вероятности единственного дерева разбора для этого предложения, т.е. P(T,S) = P(T). Вероятность женеоднозначного предложения равна сумме вероятностей всех возможных деревьев разбора данного предложения.

Вероятность полного разбора предложения вычисляется с учетом категориальной информации для каждой головной вершины каждого узла.

Пусть n – синтаксическая категория некоторого узла n; h(n) – головная вершина узла n; m(n) – материнский узел для n.

Тогда будем вычислять вероятность p(r(n)|n, h(n)), а для этого преобразуем выражение таким образом, чтобы каждое правило обусловливалось своей головной вершиной:

.

Одна из центральных проблем повышения качества машинного перевода – это включение в модель таких языковых фактов, как перефразы [5], возможные отношения синонимии синтаксических структур, в частности глагольных фраз в активном и пассивном залоге, номинализация [6]. В указанных работах предлагаются решения для отдельных видов структур, однако необходима возможно полная типизация синонимических языковых структур для выравнивания параллельных текстов и извлечения новых правил на основе методов машинного обучения.

3. Лингвистические модели на основе когнитивного трансфера.

В сформулированной ранее когнитивной трансферной грамматике (КТГ) [7,8,9] функциональные значения языковых структур определяются категориальными значениями головных вершин. Вероятностные характеристики вводятся в правила унификационной грамматики в виде весов, присваиваемых деревьям разбора. В когнитивной трансферной грамматике элементарными структурами являются трансфемы [8,9]. Трансфема – это единица МГГУ им. М.А. Шолохова www.mggu-sh.ru когнитивного переноса, устанавливающая функционально-семантическое соответствие между структурами исходного языка и структурами целевого языка. Для выравнивания параллельных текстов трансфемы задаются как правила переписывания, в которых в левой части стоит нетерминальный символ, а в правой – выравненные пары цепочек терминальных и нетерминальных символов, принадлежащих исходному и целевому языкам.

При выравнивании параллельных текстов на основе когнитивной трансферной грамматики процесс деривации начинается с пары связанных исходных символов и, далее на каждом шаге связанные нетерминальные символы попарно переписываются с использованием двух компонентов единого правила.

Актуальность проблемы создания новых гибридных методов представления языковых объектов обусловлена тем, что на современном этапе исследований встает задача оптимального сочетания сильных сторон двух исследовательских парадигм: логико-лингвистического моделирования, использующего правила, и стохастического подхода. Особое значение предлагаемая работа имеет для решения проблемы структурного анализа и компьютерного моделирования неструктурированных текстов СМИ, социальных сетей, блогов, а также полнотекстовых научных, финансово-экономических и патентных документов.

Необходимость моделирования языковых трансформаций для систем машинного перевода и извлечения знаний из текстов обусловлена тем, что до сих пор эти явления мало исследованы с точки зрения возможностей их компьютерной реализации и, соответственно, недостаточно учтены в действующих системах обработки естественного языка, а правила, задающие функциональную синонимию языковых конструкций, позволяют извлечь необходимую информацию из параллельных текстов и избежать формирования избыточных правил и «шумов» для машинного перевода.

При формировании процедур снятия неоднозначности были испольСоциальный компьютинг: Основы, Технологии развития, Социально-гуманитарные эффекты (ISc-14)»

зованы статистические данные, полученные при изучении параллельных текстов научных и патентных документов собственного экспериментального корпуса. Так, при ранжировании предпочтительности вариантов трансфера использовалась статистика соотношения личных и неличных форм глаголов и оборотов с ними, приоритетности употребления активных или пассивных конструкций, номинализаций и вербализаций в русском, английском и французском дискурсах.

Дальнейшие исследования будут связаны с расширением числа типов трансформаций в лингвистических представлениях для многоязычной ситуации, созданием инженерно-лингвистической среды исследований и разработок в области машинного перевода и извлечения знаний из текстов на разных языках. Как составная часть инженерно-лингвистической среды разрабатывается многоязычная лингвистическая база знаний, основанная на сочетании методов функционально-семантического анализа фразовых структур и статистических моделях языков, включенных в базу.

Полученные результаты используются также для выработки инновационных подходов к преподаванию курсов перевода и переводоведения, компьютерной лингвистики и когнитивных технологий.

Литература

1. Hu R., Zong Ch., Xu B. An Approach to Automatic Acquisition of Translation Templates Based on Phrase Structure Extraction and Alignment // IEEE Transactions on Audio, Speech and Language Processing, 2006. Vol. 14.

No.5. P. 1656–1663.

2. Dorr B., Habash N. Interlingua Approximation: A Generation-Heavy Approach // AMTA-2002 Interlingua Reliability Workshop. Tiburon, California, USA, 2002.

3. Voss C., Dorr B. J. Toward a Lexicalized Grammar for Interlinguas // Machine Translation, 1995. Vol. 10. No. 1–2. P. 139–180.

МГГУ им. М.А. Шолохова www.mggu-sh.ru

4. Marcus M.P., Santorini B., Marcinkiewicz M.A. Building a large annotated corpus of English: The Penn Treebank // Computational Linguistics. 1993.

Vol. 19. No. 2. P. 313–330.

5. Callison-Burch Ch., Cohn T., Lapata M. ParaMetric: An Automatic Evaluation Metric for Paraphrasing // Proceedings of the 22nd International Conference on Computational Linguistics (Coling 2008). Manchester, 2008. P. 97–104.

6. Dagan I., Bar-Haim R., Szpektor I., Greental I., Shnarch E. Natural Language as the Basis for Meaning Representation and Inference // Computational Linguistics and Intelligent Text Processing: Proceedings of the 9th Conference, CICLing 2008. Haifa, Israel, 2008. – Springer, 2008. P. 151–170.

7. KozerenkoE.B. Cognitive Approach to Language Structure Segmentation for Machine Translation Algorithms // Proceedings of the International Conference on Machine Learning, Models, Technologies and Applications, Las Vegas, USA, 2003. – CSREA Press, 2003. P. 49–55.

8. Kozerenko E. Features and Categories Design for the English-Russian Transfer Model // Advances in Natural Language Processing and Applications Research in Computing Science, 2008. Vol. 33. P. 123–138.

9. КозеренкоЕ.Б. Лингвистическое моделирование для систем машинного перевода и обработки знаний // Информатика и ее применения, 2007.

Т. 1. Вып. 1. С. 54–65.

–  –  –

Abstract. The paper focuses on the problems of creating effective language processors, combining linguistic rules and statistical models for text knowledge processing and machine translation. Statistical and heuristic models of alignment and translation are considered. To verify and specify the rules the text corpora are generated and used for retrieving cross-language correspondences and the mechanisms for aligning parallel texts are provided.

The analysis of natural language text is also seen as the task of translation into the language of the knowledge base. The solutions proposed are based on the hybrid grammar formalism comprising the linguistic rules and probability characteristics of language structures.

Keywords: statistical models, knowledge processing, machine translation, parallel texts, alignment, linguistic filters.

Kozerenko Elena B., Candidate of Science (PhD) in Linguistics, Head of Laboratory for Computational Linguistics and Cognitive Text Processing Technologies, kozerenko@mail.ru, Institute of Informatics Problems of the Russian Academy of Sciences.

–  –  –

СОЗДАНИЕ СИСТЕМЫ МОНИТОРИНГА ИНТЕРНЕТ-ТЕКСТОВ

ПО ТЕМЕ «СОЦИАЛЬНО-ПОЛИТИЧЕСКАЯ ЖИЗНЬ

РЕГИОНОВ РОССИЙСКОЙ ФЕДЕРАЦИИ»

Аннотация. В статье описывается прототип системы мониторинга Интернет-текстов по теме «Социально-политическая жизнь регионов Российской Федерации». Основой системы является модуль лингвистической обработки текста, который производит многоуровневый анализ текстов:

морфологический, синтаксический, семантический, тональный. Система работает в распределенном режиме на пяти компьютерах с использованием платформы IBM Hadoop. Результаты анализа текстов хранятся в единой базе данных. Средства работы с базами данных позволяют задавать поисковые запросы и представлять их результаты в виде графиков.

Ключевые слова: мониторинг социальных медиа, семантико-ориентированный лингвистический процессор, извлечение именованных сущностей, морфологический анализ, онтология предметной области, тональный анализ текстов, большие данные * Козеренко Елена Борисовна – к. филол.н., kozerenko@mail.ru; Институт проблем информатики Российской академии наук, Москва.

Морозова Юлия Игоревна – yulia-ipi@yandex.ru; Институт проблем информатики Российской академии наук, Москва.

Кузнецов Константин Игоревич – k.smith@mail.ru; Институт проблем информатики Российской академии наук, Москва.

Шарнин Михаил Михайлович – к.т.н., mc@keywen.com; Институт проблем информатики Российской академии наук, Москва.

Ступников Сергей Александрович – к.т.н., ssa@ipi.ac.ru; Институт проблем информатики Российской академии наук, Москва.

Брюхов Дмитрий Олегович – к.т.н., brd@ipi.ac.ru; Институт проблем информатики Российской академии наук, Москва.

Вовченко Алексей Евгеньевич – к.т.н., itsnein@gmail.com; Институт проблем информатики Российской академии наук, Москва.

Социальный компьютинг: Основы, Технологии развития, Социально-гуманитарные эффекты (ISc-14)»

Анализ текстовой информации, представленной в Интернет, является необходимой составляющей профессиональной деятельности аналитиков, маркетологов, специалистов по связям с общественностью. Круг решаемых ими задач чрезвычайно разнообразен: мониторинг социальных медиа, продвижение в социальных медиа, управление репутацией в социальных медиа, клиентская поддержка в социальных сетях и др. В связи с этим существует общественная потребность в создании информационных систем, которые бы помогали специалистам решать указанные задачи. Системы мониторинга Интернет-текстов являются востребованными и активно разрабатываются во всем мире. Для английского языка разработано более 200 систем [1], для русского языка – около 30 систем [2].

В ИПИ РАН ведутся работы по созданию семантически-ориентированной системы мониторинга Интернет-текстов, относящихся к предметной области «Социально-политическая жизнь регионов Российской Федерации (на примере одного региона)». Функция данной системы – помогать заинтересованным лицам или организациям (например, органам власти) отслеживать социальное самочувствие населения и отдельных социальных групп и своевременно реагировать на возникающие социально-экономические проблемы. На текущий момент создан работающий прототип такой системы.

С точки зрения внутренней архитектуры, разрабатываемая система предназначена для решения следующих задач:

• извлечение данных из различных информационных ресурсов;

• смысловая обработка неструктурированных и слабоструктурированных данных (тексты, Beб и пр.);

• формирование структурированной базы данных;

• интеграция полученных в результате отбора и структуризации данных в массивно-параллельной архитектуре;

• реализация аналитических запросов над структурированной базой данных и визуализация результатов.

МГГУ им. М.А. Шолохова www.mggu-sh.ru В качестве материала для проверки работы системы используются различные информационные ресурсы: архивы региональных электронных СМИ, социальные сети (на примере сайта «Вконтакте»), сервисы микроблогов (на примере сайта «Twitter»). Ресурсы существенным образом различаются по структуре, а также по характеру и лексике текстов. Таким образом, программные средства должны быть настроены на каждый тип источника по отдельности. Из всех материалов, доступных на указанных информационных ресурсах, для скачивания выбираются те материалы, которые имеют наибольшую ценность в рамках решаемой задачи: опубликованные недавно (например, в текущем году) авторами, проживающими в изучаемом регионе. Такие статьи и сообщения социальных сетей извлекаются из соответствующих ресурсов, загружаются в Hadoop [3] и обрабатываются с помощью средств лингвистического анализа, развернутых на каждом из узлов кластера.

Семантико-ориентированный лингвистический процессор [4] производит многоуровневую и многоплановую обработку текстов, в которую входит морфологический анализ, синтаксический анализ, семантический анализ с выделением именованных сущностей, тональный анализ, соотнесение выделенных сущностей с онтологической базой данных.

Статьи и сообщения, обогащенные информацией, извлеченной из текстов, преобразуются к виду, удовлетворяющему единой схеме хранилища.

Данные, извлеченные из профилей пользователей социальных сетей, также помещаются в хранилище. Определение отношения населения к экономическим и политическим вопросам может быть осуществлено путем различных запросов к схеме хранилища.

76 Социальный компьютинг: Основы, Технологии развития, Социально-гуманитарные эффекты (ISc-14)»

Литература

1. Список систем мониторинга социальных медиа на английском языке.

–URL: http://wiki.kenburbary.com/social-meda-monitoring-wiki (дата обращения: 2014-09-08).

2. Список систем мониторинга социальных медиа на русском языке. – URL: http://ipiranlogos.com/ru/sm-monitoring-systems/ (дата обращения: 2014-09-08).

3. Платформа IBM для больших данных. – URL: http://www-03.ibm.com/ software/products/ru/category/bigdata (дата обращения: 2014-09-08).

4. Kuznetsov I.P., Kozerenko E.B., Matskevich A.G. Intelligent extraction of knowledge structures from natural language texts // Proceedings of the 2011 IEEE/WIC/ACM International Joint Conferences on Web Intelligence and Intelligent Agent Technology – Workshops, WI-IAT 2011, P. 269-272.

–  –  –

SOCIAL MONITORING SYSTEM IN THE SUBJECT DOMAIN

“SOCIAL AND POLITICAL LIFE OF RUSSIAN FEDERATION REGIONS”

Abstract. The article describes the prototype of the social media monitoring system developed for the subject domain « Social and political life of Russian Federation regions ». The system is based on the module of linguistic

processing which performs analysis of natural language texts at different levels:

morphological analysis, syntactic analysis, semantic analysis and sentiment analysis. The systems functions in the distributed mode on five computers via the IBM Hadoop Platform. The analysis results are stored in a single data base.

МГГУ им. М.А. Шолохова www.mggu-sh.ru Data base management tools make it possible to query the data base and visualize the queries results.

Keywords: social media monitoring, semantic linguistic processor, named entities recognition, morphological analysis, subject domain ontology, sentiment analysis, big data Kozerenko Elena B. – PhD, kozerenko@mail.ru; Institute of Informatics Problems of the Russian Academy of Sciences, Moscow.

Morozova Yuliya I. – postgraduate, yulia-ipi@yandex.ru; Institute of Informatics Problems of the Russian Academy of Sciences, Moscow.

Kuznetsov Konstantin I. – k.smith@mail.ru; Institute of Informatics Problems of the Russian Academy of Sciences, Moscow.

Sharnine Mikhail M. – PhD, mc@keywen.com; Institute of Informatics Problems of the Russian Academy of Sciences, Moscow.

Stupnikov Sergey A. – PhD, ssa@ipi.ac.ru; Institute of Informatics Problems of the Russian Academy of Sciences, Moscow.

Briukhov Dmitry O. – PhD, brd@ipi.ac.ru; Institute of Informatics Problems of the Russian Academy of Sciences, Moscow.

Vovchenko Alexey E. – PhD, itsnein@gmail.com; Institute of Informatics Problems of the Russian Academy of Sciences, Moscow.

–  –  –

ДИАЛОГИЧЕСКИЕ ПОВТОРЫ С КАК,

ГДЕ И ПОЧЕМУ В РУССКОМ ЯЗЫКЕ

Аннотация. Доклад посвящен исследованию русских диалогических конструкций– повторов с вопросительными наречиями как, где и почему на материале Национального корпуса русского языка. В целом, повторы в таких конструкциях строятся по аналогичным правилами. Тем не менее, обнаруживаются структурные и семантические различия. Конструкции с как и почему могут содержать факультативные частицы же и это, а наречие где обязательно сочетается с же. Конструкции с как обычно выражают сомнение, тогда как где и почему имплицируют отрицание сказанного. Мы предполагаем, что эти особенности могут быть связаны с семантикой обсуждаемых наречий в типичных вопросительных конструкциях.

Ключевые слова: русские диалогические конструкции.

Доклад посвящен исследованию русских диалогических конструкций– повторов с вопросительными наречиями как, где и почему на материале Национального корпуса русского языка (www.ruscoropra.ru)**.

Ниже даны примеры таких конструкций:

(1) – Дедушка, – говорю я, – расскажи, как вас угоняли? – А нас и не угоняли, мы сами, – отвечает дедушка. – Да как же не угоняли, когда – и в книжках об этом написано, – г оворю я. [Фазиль Искандер. Дедушка (1966)] (2) – Я тоже, потому как – с тобой. – Ты умный. Ты же не со мной. – Где ж *Коношенко Мария Борисовна – eleiteria@gmail.com; Московский государственный гуманитарный университет им. М.А. Шолохова, Москва.

** Исследование выполнено приподдержкегрантаРНФ14-18-03270 «Типология порядка слов, коммуникативно-синтаксический интерфейс и информационная структура высказывания в языках мира».

МГГУ им. М.А. Шолохова www.mggu-sh.ru не с тобой, когда вот он я. Ехала бы сама в психушку. – И поехала бы. – Вот и ехала бы! [Кира Сурикова. Буду (2003)] (3) – Зря я приехал, – вырывается у Стрепетова. Пауза. Михайлов некоторое время молчит,потомговорит: – Почему же зря – может быть, как раз вовремя. [Владимир Маканин. Отдушина (1977)] В работе Н.Ю.Шведовой дано следующее определение диалогического повтора: «[п]овтор – это построенная по правилам разговорной речи вторая реплика, выражающая экспрессивно окрашенную реакцию на сказанное, имеющая в качестве своей структурной основы те или иные элементы словесного состава первой реплики и подчиняющаяся ее форме» [2, С. 69].

Настоящий доклад продолжает исследования диалогической цитации, начатые в работах Н.Ю.Шведовой [2] и Н.Д.Арутюновой [1]. В докладе обсуждаются дистрибутивные свойства вопросительных наречий в конструкциях-повторах, формальная структура повторов, а также их семантика.

Наречия как и почему свободно сочетаются с частицами же и это, но могут употребляться и без них. В примерах (1, 3) выше можно заменить же на это или убрать частицу. Наречие где в обсуждаемых здесь конструкциях всегда употребляется с частицей же – в (2) частицу же нельзя ни заменить, ни опустить.

Обсуждаемые здесь конструкции-повторы обладают целым рядом общих структурных особенностей.

Повторяемый элемент чаще всего находится в реме предыдущего высказывания, если оно утвердительное. Это приводит к частой редукции подлежащего, которое обычно относится к теме высказывания.

В повторах возможно изменение личной формы глагола со 2 лица на 1 и наоборот:

(4) Кто, ты говоришь, говорил по телефону? – Да папа же, папа! – с обидой воскликнул он. – Ты что, не слушаешь? – Как же не слушаю? Слушаю!

– успокоил я. [Вера Белоусова. Второй выстрел (2000)] Социальный компьютинг: Основы, Технологии развития, Социально-гуманитарные эффекты (ISc-14)»

Если в группе вершина-зависимое возражение у собеседника вызывает только зависимое, оно копируется и появляется без вершины:

(5) Поверьте, что появление этого негодяя мне так же неприятно, как вам, но только не ищите, пожалуйста, за ним, как теперь любят выражаться, силы войны и тайных происков. – Почему же тайных? – спросил я. – Как же тайных, когда... – Когда мы ежедневно читаем газеты и сами даже издаём одну, самую крикливую. [Юрий Домбровский. Обезьяна приходит за своим черепом. Пролог (1943–1958)] С точки зрения семантики, обсуждаемые конструкции-повторы могут выражать сомнение в истинности сказанного в предыдущей реплике либо полное несогласие с содержанием предыдущей реплики, в таких случаях они имплицируют отрицание сказанного выше. Как будет показано в докладе, как-реплики обычно тяготеют к сомнению (удивлению/непониманию), а где– и почему-реплики чаще всего выражают отрицание сказанного выше.

На наш взгляд, это может быть связано со свойствами обсуждаемых наречий в обычных вопросах. Как означает вопрос к образу действия, то речь идет об описании события изнутри. Где и почему предполагают вопрос о месте и причине события, которые являются внешними по отношению к событию. Различные типы модификации события – внутренняя для как и внешняя для где и почему – наследуются в диалогических повторах: как предполагает частичное несогласие с требованием уточнить сказанное, а где и почему полностью меняют полярность высказывания.

Заключение. Настоящий проект объединяет методологические разработки, созданные в рамках теоретической лексической семантики, традиционной лексикографии, корпусно-ориентированного подхода к языку и современных методов представления информации, используемых при описании лексики. Коллектив использует собственную методологию лексикографической полевой работы, синтезирующую достижения всех перечиМГГУ им. М.А. Шолохова www.mggu-sh.ru сленных подходов. В ходе проекта с применением этой методологии была создана электронная словарная база объёмом около 4,5 тыс. входов. В настоящее время основными направлениями работы являются расширение и уточнение словарной базы и разработка онлайн-интерфейса словаря.

Литература

1. Апресян Ю.Д. Исследования по семантике и лексикографии. Т. I: Парадигматика. М.: Языки славянских культур, 2009

2. Апресян Ю.Д. Новый объяснительный словарь синонимов русского языка. М.: Языки славянских культур, 1999; 2000; 2003

3. Люкина Н. М. Особенности языка балезинских и юкаменских бесермян.

Дисс. на соиск. уч. ст. к. филол. н., Ижевск, 2008

4. Тепляшина Т.И. Язык бесермян. М., 1970

5. Dziemianko, A. On the use(fulness) of paper and electronic dictionaries. //

S. Granger, M. Paquot (eds.): Electronic Lexicography, pp. 319-341. Oxford:

Oxford University Press, 2012

6. Facchinetti, R. Theoretical Description and Practical Applications of Linguistic Corpora. Verona: QuiEdit, 2007

7. Hanks, P. The impact of corpora on dictionaries. // P. Baker (ed.):

Contemporary Corpus Linguistics, pp. 214-236. London: Continuum, 2009

8. Sinclair, J. (ed.). Collins COBUILD English Language Dictionary. London:

HarperCollins Publishers, 1987

–  –  –

Abstract. In this talk, I discuss Russian dialogue repetition constructions with question adverbs kak, gde, and pochemu based on data from Russian national corpus. These constructions reveal a similar structure of repetition but their semantics and the distributional properties of the adverbs tend to differ. Kak and pochemu-constructions may have optional particles zhe and eto whereas gde can only be used with zhe. Kak-constructions tend to express doubt or surprise while pochemu and gde-constructions negate the repeated segment implicitly. I argue that this difference is connected with the semantic properties of these adverbs in prototypical questions.

Keywords: Russian dialogical structure.

Konoshenko Maria B. – PhD, eleiteria@gmail.com; Sholokhov Moscow State University for the humanities, Moscow.

–  –  –

КОРПУС ИСТОРИЙ КАК ОБЪЕКТ ИССЛЕДОВАНИЙ

Аннотация. В сообщении предлагается программа создания и исследования корпуса текстов историй, собранных на сайте anekdot.ru, как способа изучения интернет-дискурса.

* Назаров Николай Всеволодович – к.филол.н., nickolaynazarov@gmail.com; Московский государственный гуманитарный университет им. М.А. Шолохова, Москва.

–  –  –

1. Введение. Создание лингвистических корпусов стало в настоящий момент нормой лингвистических исследований. Изучение интернет-дискурса требует проектирования и создания корпусов высказываний, способных отражать основные закономерности построения дискурса в коммуникативной среде Интернета. Цель данного сообщения – предложить программу создания и исследования корпуса текстов историй, собранных на сайте anekdot.ru, как способа изучения интернет-дискурса.

2. Корпус как объект и инструмент исследования. Возникшая в середине ХХ века корпусная лингвистика в настоящее время активно развивается благодаря совершенствованию технологий обработки текстов [1, 2].

Нормой становится создание как больших корпусов, отражающих использование языка в целом, во всех его разновидностях, стилистических и дискурсивных вариантах (ruscorpora.ru), так и относительно небольших корпусов, посвященных функционированию языка в той или иной социальной группе, социальной практике, коммуникативной среде, выделенной по какому-либо специальному признаку [3].

Особенностью корпуса является наличие у него инструментов поиска, позволяющих выявлять и представлять в обозримом виде особенности употребления языковых единиц, конструкций, различных их сочетаний.

Для использования этих инструментов текст подвергается специальной разметке, включающей грамматическую, семантическую, а также любую другую лингвистически релевантную информацию, определяемую исходя из целей создания корпуса.

3. Корпус историй как образец интернет-дискурса. Интернет-дискурс представляет собой специфическую коммуникативную среду [4], в которой отчасти снимаются традиционные для лингвистики оппозиции «устная/ письменная речь», «спонтанная/подготовленная речь», «литературная речь/ Социальный компьютинг: Основы, Технологии развития, Социально-гуманитарные эффекты (ISc-14)»

просторечие» и т.д. Исследование интернет-дискурса должно отражать специфику этой среды как в аспекте порождения текста, так и его восприятия.

Одной из особенностей интернет-коммуникации является очень быстрое «старение» данных, регулярное появление новых и исчезновение старых ресурсов, центров коммуникации, способов и средств общения. Это роднит интернет-коммуникацию с устной речью, всегда составлявшей особую проблему для лингвистической фиксации и последующего изучения.

Тем большего внимания заслуживают ресурсы, которые существуют в течение многих лет, привлекая внимание и концентрируя активность различных пользователей Интернета. Одним из таких ресурсов является сайт anekdot.ru, с 1998 года собирающий и публикующий различные произведения народного творчества – анекдоты, афоризмы, истории, юмористические стихи и рисунки. На сайте действует система открытой публикации и оценки публикуемых материалов.

Из всех публикуемых материалов особый интерес представляют истории – более или менее развернутые повествования об интересных, забавных или неожиданных событиях, произошедших (или якобы произошедших – обсуждение правдивости историй является частью сложившейся традиции рассказывания и оценки историй) в реальности. Они интересны и тем, что предполагают большую меру самостоятельности авторов по сравнению с анекдотами, и тем, что отражают реальные процессы, происходящие в обществе в целом и в интернет-сообществе в частности.

Предметом изучения при работе с корпусом историй может быть как собственно употребление языка (выделение специфических языковых единиц и конструкций, описание устойчивых структур дискурса – напр., [5]), так и складывание норм коммуникации в новой коммуникативной среде. При этом можно выделять как локальные нормы, действующие только в рамках данного ресурса (например, ставшее традиционным на этом сайте членение повествования на «преамбулу» и «амбулу»), так и более общие МГГУ им. М.А. Шолохова www.mggu-sh.ru нормы, отражающие глобальную социальную динамику. Такие аспекты становятся доступны при анализе тематики историй, выявлении типичных персонажей и их оценки авторами и комментаторами историй.

В целом создание подобного корпуса представляется перспективным направлением исследовательской работы, которая уже начата и может в будущем стать прототипом аналогичных корпусных исследований других дискурсивных разновидностей русского языка в Интернете.

Литература

1. АпресянЮ.Д., БогуславскийИ.М., ИомдинБ.Л. и др.Синтаксически и семантически аннотированный корпус русского языка: современное состояние и перспективы// Национальный корпус русского языка:

2003—2005. М.:Индрик, 2005, С. 193—214.

2. ПлунгянВ.А.Корпус как инструмент и как идеология: о некоторых уроках современной корпусной лингвистики// Русский язык в научном освещении, 2008, No. 16 (2), С. 7—20.

3. Рассказы о сновидениях: Корпусное исследование устного русского дискурса/ Под ред. А. А Кибрика,В. И. Подлесской. М.: Языки славянских культур, 2009 – 773 с.

4. Долгоруков А.М. Методы исследования в е-Этнометодологической перспективе // Материалы Второй Международной научно-практической конференции «Социальный компьютинг: основы, технологии развития, социально-гуманитарные эффекты» (ISC-13): Сборник статей и тезисов. Москва: Изд-во, 2013. С. 280-294.

5. Назаров Н.В. Структура повествования в интернет-дискурсе: как рассказываются истории // Материалы Всероссийского совещания славистов, посвященного 1150-летию славянской письменности и 110-летию первого Съезда русских славистов, 7-9 ноября 2013 г. М., 2013. – C.

113-121.

–  –  –

Abstract. The report proposes a program of research and development work corpus of stories collected online anekdot.ru, as a way of studying online discourse.

Keywords: discourse, corpus, sociology of the Internet.

Nazarov Nikolay V. – PhD, nickolaynazarov@gmail.com; Sholokhov Moscow State University for the humanities, Moscow.

–  –  –

ОПЫТ СОЗДАНИЯ МОДУЛЯ УПРАВЛЕНИЯ

ДИАЛОГОМ С РОБОТОМ-ГИДОМ

Аннотация. Доклад описывает модуль диалога, разработанный для подвижного робота-гида в рамках алгоритмического подхода. Диалогом представлен как сеть переходов системы из одного состояния в другое в зависимости от двух факторов: коммуникативного и визуального. Описываются детали модуля управления диалогом.

Ключевые слова: диалог, робот-гид, управление диалогом, речевые акты * Циммерлинг Антон Владимирович – д.ф.н., проф, fagraey64@hotmail.com; Московский государственный гуманитарный университет им. М.А. Шолохова.

Кобозева Ирина Михайловна – д.ф.н., kobozeva@list.ru; Московский государственный университет им. М.В.Ломоносова.

Сидоров Григорий Олегович – к.ф.н., проф., sidorov@cic.ipn.mx; Национальный политехнический институт, Мехико.

Работа выполнена при финансовой поддержке Министерства образования и науки Российской Федерации, федеральный проект (госзадание) 2685 «Параметрическое описание грамматических систем».

МГГУ им. М.А. Шолохова www.mggu-sh.ru

1. Диалог с роботом-гидом. В докладе описывается алгоритмический подход к моделированию диалога на естественном языке с подвижным роботом, выполняющим функцию гида. Для ряда задач компьютерной лингвистики наиболее подходящими считаются методы машинного обучения на основе размеченных корпусов. Для применения этих методов строится модель векторного пространства (vector space model), см. [3]. Для других задач, например, для определения грамматических значений слов, частеречной принадлежности слов, машинного перевода, распознавания речи необходимы алгоритмические подходы. В работе [5] не было получено данных о том, что методы машинного обучения позволяют хорошо моделировать диалог. Проблема состоит в том, что на данном этапе развития теории обработки текста семантические и прагматические признаки речевых актов автоматически выделить сложно [8].

В нашем случае диалоговый модуль разработан для системы, не имеющей модуля «обширных знаний».

В качестве моделируемой избирается сравнительно простая функция робота-гида, предполагающая контроль за ходом диалога со стороны робота и сужающая репертуар необходимых коммуникативных актов [4]. Робот Pioneer 3DX сопоставим по размерам с человеком и снабжен точным лазерным датчиком измерения расстояний до возможных препятствий на его пути. Робот выступает в функции гида, проводящего посетителей по одному из этажей института, и движется по предварительно подготовленной карте, на которой помечены выделенные объекты, являющиеся главной целью показа, например, офис администрации (Admin) и лаборатория (IA). Появление новых для робота (отсутствующих на карте) объектов не является препятствием для робота – он способен их объезжать. Робот знает, когда каждый объект становится видимым человеку – это происходит, если между ними нет препятствия и расстояние достигло порогового значения: мы предлагаем установить порог до 3 метров.

Социальный компьютинг: Основы, Технологии развития, Социально-гуманитарные эффекты (ISc-14)»

Модель управления диалогом представлена как сеть переходов системы из одного состояния в другое в зависимости от двух факторов: коммуникативного и визуального. Система включает модуль распознавания речи Dragon Naturally Speaking и модуль синтаксического анализа Freeling, описанный в [2]. Система тестирована для испанского языка, но может быть настроена на другие естественные языки, включая русский.



Pages:     | 1 | 2 || 4 | 5 |   ...   | 14 |

Похожие работы:

«Научно-издательский центр «Социосфера» Семипалатинский государственный университет им. Шакарима Пензенская государственная технологическая академия СОЦИАЛЬНО-ЭКОНОМИЧЕСКОЕ РАЗВИТИЕ И КАЧЕСТВО ЖИЗНИ: ИСТОРИЯ И СОВРЕМЕННОСТЬ Материалы II международной научно-практической конференции 15–16 марта 2012 года Пенза–Семей УДК 316.42+338.1 ББК 60.5 С 69 С 69 Социально-экономическое развитие и качество жизни: история и современность: материалы II международной научно-практической конференции 15–16 марта...»

«Библиография научных печатных работ А.Е. Коньшина 1990 год Коньшин А.Е. Некоторые проблемы комизации школы 1. государственных учреждений в 1920-30-е годы // Проблемы функционирования коми-пермяцкого языка в современных условиях.Материалы научно-практической конференции в г. Кудымкаре. Кудымкар: Коми-Перм. кн. изд., 1990. С. 22-37.2. Коньшин А.Е. Мероприятия окружной партийной организации по становлению системы народного образования в Пермяцком крае в первые годы Советской власти // Коми...»

«Козляков В. Е. Современная историография Беларуси: некоторые тенденции в изучении отечественной истории. В. Е. Козляков // Российские и славянские исследования : науч. сб. Вып. 4 / редкол.: А. П. Сальков, О. А. Яновский (отв. редакторы) [и др.]. — Минск: БГУ, 2009. — С. 221-232 В. Е. Козляков СОВРЕМЕННАЯ ИСТОРИОГРАФИЯ БЕЛАРУСИ: НЕКОТОРЫЕ ТЕНДЕНЦИИ В ИЗУЧЕНИИ ОТЕЧЕСТВЕННОЙ ИСТОРИИ Процессы, происходившие на постсоветском пространстве в последние 15—20 лет, не могли не сказаться на состоянии и...»

«Министерство образования и науки РФ Российская академия наук Институт славяноведения Институт русского языка им. В.В. Виноградова СЛАВЯНСКИЙ МИР: ОБЩНОСТЬ И МНОГООБРАЗИЕ К 1150-летию славянской письменности 20–21 мая 2013 г. МЕЖДУНАРОДНАЯ НАУЧНАЯ КОНФЕРЕНЦИЯ Тезисы Москва 20 Ответственный редактор доктор исторических наук К.В. Никифоров ISBN 5 7576-0277У Институт славяноведения РАН, 20 У Авторы, 20 СОДЕРЖАНИЕ Секция «Славянский мир в прошлом и настоящем» А.М. Кузнецова Еще раз о Кирилле и...»

«Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Российская академия народного хозяйства и государственной службы при Президенте Российской Федерации» СИБИРСКИЙ ИНСТИТУТ УПРАВЛЕНИЯ ОБЩЕСТВО И ЭТНОПОЛИТИКА Материалы Шестой Международной научно-практической Интернет-конференции 1 мая — 1 июля 2013 г. Под научной редакцией кандидата политических наук Л. В. Савинова НОВОСИБИРСК ББК 66.3(2)5,я431 О-285 Издается в соответствии с планом научной...»

«ИННОВАЦИОННЫЙ ЦЕНТР РАЗВИТИЯ ОБРАЗОВАНИЯ И НАУКИ INNOVATIVE DEVELOPMENT CENTER OF EDUCATION AND SCIENCE АКТУАЛЬНЫЕ ВОПРОСЫ ЮРИСПРУДЕНЦИИ Выпуск II Сборник научных трудов по итогам международной научно-практической конференции (12 марта 2015г.) г. Екатеринбург 2015 г. УДК 34(06) ББК 67я Актуальные вопросы юриспруденции / Сборник научных трудов по итогам международной научно-практической конференции. № 2. Екатеринбург, 2015. 60 с. Редакционная коллегия: гранд доктор философии, профессор,...»

«МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ МЕДИКО-СТОМАТОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ Кафедра истории медицины ИСТОРИЯ СТОМАТОЛОГИИ III Всероссийская конференция (с международным участием) Доклады и тезисы МГМСУ Москва — 2009 УДК 616.31.000.93 (092) ББК 56.6 + 74.58 История стоматологии. III Всероссийская конференция «История стоматологии». Доклады и тезисы.с международным участием /под редакцией К. А. Пашкова/. — М.: МГМСУ, 2009. — 176 с. Кафедра истории медицины Московского государственного...»

««Первая мировая война и судьбы европейской цивилизации» №1 (2014) Коллективная монография «Первая мировая война и судьбы европейской цивилизации» Первая мировая война и судьбы европейской цивилизации / Под ред. Л.С. Белоусова, А.С. Маныкина. – М.: Издательство Московского университета, 2014. – 816 с. Аннотация. Коллективная монография «Первая мировая война и судьбы европейской цивилизации» была подготовлена преподавателями исторического факультета МГУ при сотрудничестве со специалистами из...»

«Правительство Оренбургской области Научно исследовательский институт истории и этнографии Южного Урала Оренбургского государственного университета Франко российский центр гуманитарных и общественных наук в Москве РОССИЯ – ФРАНЦИЯ. ГОСУДАРСТВЕННАЯ КОНФЕССИОНАЛЬНАЯ И МИГРАЦИОННАЯ ПОЛИТИКА: ИСТОРИЧЕСКИЙ ОПЫТ, ПРАВОВОЕ РЕГУЛИРОВАНИЕ И ПРАКТИКА РЕАЛИЗАЦИИ Материалы Международной научной конференции Оренбург Россия – Франция. Государственная конфессиональная и миграционная политика УДК 327.3(063) ББК...»

«Комиссия по стратегии: роль ICANN в экосистеме управления Интернетом1 (со списком ошибок, v.20142302) Содержание 1. Преамбула 2. Все и всё в Интернете 3. Значение термина «управление»4. Перспективы управления Интернетом 5. Составление карты экосистемы управления Интернетом 6. Принципы ICANN в этой экосистеме 7. Перспективный план глобализации ICANN 8. Выводы ПРИЛОЖЕНИЕ A. История ICANN и Министерства торговли США (МТ) ПРИЛОЖЕНИЕ Б. Возможно, один-единственный «конституционный момент» никогда не...»

««Исижзия пзедджв всегда любжпыина для ижгж, диж джсижин иееиь Оиечесивж». Н. Кар а м з и н. О ВОЙНЕ НАПИСАНО НЕ ВСЕ. Материалы историко-краеведческой конференции Центральная городская библиотека Вилючинск 2005 год – юбилейный. Это год 60-летия Победы нашего народа в Великой Отечественной войне и 60-летия окончания Второй мировой войны, последней операцией которой был Курильский десант. 26 октября 2005 года в Центральной городской библиотеке г. Вилючинска состоялась историко-краеведческая...»

«МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ МЕДИКО-СТОМАТОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ Кафедра истории медицины ИСТОРИЯ СТОМАТОЛОГИИ IV Всероссийская конференция (с международным участием) Чтения, посвященные памяти профессора Г.Н. Троянского Доклады и тезисы Москва – УДК 616.31.000.93 (092) ББК 56.6 + 74.5 IV Всероссийская конференция «История стоматологии». Чтения, посвященные памяти профессора Г.Н. Троянского. Доклады и тезисы. М.:МГМСУ, 2010, 117 с. Кафедра истории медицины Московского государственного...»

«ИННОВАЦИОННЫЙ ЦЕНТР РАЗВИТИЯ ОБРАЗОВАНИЯ И НАУКИ INNOVATIVE DEVELOPMENT CENTER OF EDUCATION AND SCIENCE АКТУАЛЬНЫЕ ВОПРОСЫ И ПЕРСПЕКТИВЫ РАЗВИТИЯ ОБЩЕСТВЕННЫХ НАУК Выпуск II Сборник научных трудов по итогам международной научно-практической конференции (7 мая 2015г.) г. Омск 2015 г. УДК 3(06) ББК 60я43 Актуальные вопросы и перспективы развития общественных наук / Сборник научных трудов по итогам международной научно-практической конференции. № 2. Омск, 2015. 61 с. Редакционная коллегия:...»

«Ab Imperio, 1/200 Ярослав ГрыцаК нацИоналИзИруЯ мноГоэтнИчное ПространстВо: ИсторИИ ИВана франКо И ГалИцИИ* Нет, это не история про испанского каудильо Франциско Франко (Francisco Franco) и про испанскую же Галисию. Наша история – про украинского писателя Ивана Франко из габсбургской Галиции. Украинского и испанского Франко роднит не только фамилия, но и предполагаемое еврейское происхождение.1 Если это так, то история их родов может быть косвенным свидетельством масштабности обращения иудеев в...»

«Егоров Сергей Борисович ИЗУЧЕНИЕ ВЕПСОВ НА КАФЕДРЕ ЭТНОГРАФИИ И АНТРОПОЛОГИИ ИСТОРИЧЕСКОГО ФАКУЛЬТЕТА САНКТ-ПЕТЕР БУРГСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА В публикации в перв ые рассматривается работа кафедры этнографии и антропологии исторического факультета Санкт-Петербургского государств енного унив ерситета по изучению в епсов одного из прибалтийско-финских народов России. Изучение этого этноса опиралось в значительной степени на полев ые исследов ания, пров одив шиеся в ходе экспедиционной...»

«Г.В. Иванова, Ю.Ю. Юмашева Историография просопографии В 2002 г. Ассоциация «История и Компьютер» торжественно отме тила свое десятилетие. В этой связи, казалось бы, было бы естественным появление историографических работ, посвященных анализу (возможно, даже выполненному с применением количественных методов) суще ствования и функционирования в России такого научного направле ния, как историческая информатика, научной деятельности в данном направлении Ассоциации и динамике развития в рамках...»

«Сводный отчет по сетевому, межрегиональному проекту «Российско-китайское сотрудничество: региональное (сибирско-дальневосточное) измерение»Руководитель сетевого проекта: Лузянин Сергей Геннадьевич, профессор, доктор исторических наук Срок выполнения: март-декабрь 2006 г Исполнители Томский, Уральский, Иркутский и Дальневосточный региональные МИОНы. Цели задачи проекта комплексное изучение и анализ развития российскокитайского регионального сотрудничества, разработка сценариев регионального...»

«С.П. Капица Сколько людей жило, живет и будет жить на земле. Очерк теории роста человечества. Москва Эта книга посвящается Тане, нашим детям Феде, Маше и Варе, и внукам Вере, Андрею, Сергею и Саше Предисловие Глава 1 Введение Предисловие Человечество впервые за миллионы лет переживает эпоху крутого перехода к новому типу развития, при котором взрывной численный рост прекращается и население мира стабилизируется. Эта глобальная демографическая революция, затрагивающая все стороны жизни, требует...»

«2я Международная конференция «Межбиблиотечный абонемент и доставка документов – важное средство сохранения и развития единого информационного и культурного пространства государств-участников СНГ» Москва 23-25 ноября 2011 г Паклин Алексей Геннадьевич заведующий отделом электронной доставки и абонементного обслуживания Государственная публичная историческая библиотека России, Москва Роль информационно-поисковых ресурсов Государственной публичной исторической библиотеки России в работе электронной...»

«Правительство Оренбургской области Научно исследовательский институт истории и этнографии Южного Урала Оренбургского государственного университета Филологический факультет Оренбургского государственного педагогического университета СЛАВЯНЕ В ЭТНОКУЛЬТУРНОМ ПРОСТРАНСТВЕ ЮЖНО УРАЛЬСКОГО РЕГИОНА Материалы XI международной научно практической конференции, посвященной Дню славянской письменности и культуры Оренбург СЛАВЯНЕ В ЭТНОКУЛЬТУРНОМ ПРОСТРАНСТВЕ ЮЖНО УРАЛЬСКОГО РЕГИОНА УДК 39:811.16(470.56)...»







 
2016 www.konf.x-pdf.ru - «Бесплатная электронная библиотека - Авторефераты, диссертации, конференции»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.