2018 №2 (39)



Рубцова Ю. В.
Институт систем информатики СО РАН, Новосибирский государственный университет,
630090, Новосибирск, Россия
 
МОДЕЛЬ НЕЙРОННОЙ СЕТИ ДЛЯ ПРЕОДОЛЕНИЯ ДЕГРАДАЦИИ РЕЗУЛЬТАТОВ КЛАССИФИКАЦИИ ТЕКСТОВ ПО ТОНАЛЬНОСТИ
 
УДК 004.912
В данной работе описан алгоритм построения классификатора текстов по тональности, ис­пользующий пространство распределенных представлений слов и нейронную языковую модель Skip-gram. Экспериментально показано, что построенная модель классификатора текстов может быть перенесена на коллекции, собранные в другой временной промежуток без потери качества классификации.
Ключевые слова: анализ тональности, классификация текстов, машинное обучение.
 
Библиографическая ссылка: журнал Проблемы информатики,  2018, № 2. С.4-14
___________________________________________________________________
Разакова М. Г. 
АО „Национальный центр космических исследований и технологий", 050010, г, Алма-Ата, Казахстан
 
РАДИОЛОКАЦИОННЫЕ МЕТОДЫ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ЛЕСНЫХ МАССИВОВ
 
УДК 550.388.2
На основе анализа набора статистической информации по данным радиолокационной съем­ки определен оптимальный уровень фильтрации для автоматического выделения основных объектов наблюдаемой поверхности. Анализ производился по данным с космического аппарата TerraSAR-X в согласованной и кросс-поляризациях (VV, VH). Показано, что территория, покрытая растительностью, имеет максимальные различия в кросс-поляризационных изображениях, выделены контуры лесного массива.
Ключевые слова: радиолокационные спутниковые данные, лесной массив, классификация.
 
Библиографическая ссылка: журнал Проблемы информатики,  2018, № 2. С.15-23
___________________________________________________________________

Бредихин С. В.,  Ляпунов В. М., Щербакова Н. Г. 
Институт вычислительной математики и математической геофизики СО РАН,
630090, Новосибирск, Россия
 
СПЕКТРАЛЬНЫЙ АНАЛИЗ СЕТИ ЦИТИРОВАНИЯ НАУЧНЫХ ЖУРНАЛОВ
 
УДК 001.12+303.2
Исследуются спектральные методы анализа сети научных публикаций, организованной на отношении цитирования и представленной орграфом GD = (V,E). Сравниваются результаты работы двух спектральных алгоритмов кластеризации. Орграф GD преобразуется в три неориентированных графа: A + AT (граф GU), A х AT (граф Gbib) и AT х A (граф Gcoc); здесь A матрица смежности GD. Кластеризации графов Gu, Gbib и Gcoc выполнены с помощью алгоритмов WTR и LEV. Агломеративный алгоритм WTR основан на матрице случайного блуждания P = D-1A, алгоритм бикластеризации LEV — на матрице модульности. Для сравнения результатов разбиения используются индексы NMI, RAND, ADJUSTED_RAND. В результате исследования выявлена зависимость результатов кластеризации от способа приведения GD к неориентированному виду; кластеры журналов, построенные с помощью алгоритма WTR, могут быть проинтерпретированы в терминах принадлежности к тематическим областям. Результаты представлены в виде таблиц.
Ключевые слова: сеть цитирования журналов, сеть коцитирования, сеть библиографи­ческого сочетания, взвешенный ориентированный граф, разбиение графа, спектральная кла­стеризация.
 
Библиографическая ссылка: журнал Проблемы информатики,  2018, № 2. С.24-40
___________________________________________________________________
Благодарный А. И.
Институт вычислительных технологий СО РАН, 630090, Новосибирск, Россия
 
ПРОГРАММНЫЙ ИНСТРУМЕНТАРИЙ ДЛЯ ПОСТРОЕНИЯ СИСТЕМ АВТОМАТИЗИРОВАННОГО УПРАВЛЕНИЯ В СРЕДЕ ОТЕЧЕСТВЕННОЙ ОПЕРАЦИОННОЙ СИСТЕМЫ
УДК 004.9
 
Описывается архитектура,  схемы взаимодействия компонент и инструментальное ядро SCADA-системы на платформе отечественной защищенной операционной системы реального времени «Нейтрино КПДА.10964-01». Продукт является результатом развития  SCADA-системы  «Блакарт», разработанной в ИВТ СО РАН и работавшей в среде OC QNX 4.25
Указанная SCADA-система показала высокие эксплуатационные качества в десятках реализованных систем управления в различных отраслях промышленности, как правило, на опасных производствах. Использование сертифицированной отечественной операционной системы является нужным шагом в направлении киберустойчивости.
Ключевые слова: SCADA, импортозамещение программного обеспечения, QNX, Нейтрино.
 
Библиографическая ссылка: журнал Проблемы информатики,  2018, № 2. С.41-51
___________________________________________________________________
Куликов И.М., Черных И. Г. 
Институт вычислительной математики и математической геофизики СО РАН,
630090, Новосибирск, Россия
 
GOOPHI: НОВЫЙ КОД ДЛЯ МОДЕЛИРОВАНИЯ АСТРОФИЗИЧЕСКИХ ТЕЧЕНИЙ НА СУПЕРЭВМ, ОСНАЩЕННЫХ УСКОРИТЕЛЯМИ INTEL XEON PHI
 
УДК 519.6, 524.3
В статье изложен новый гидроднамический код gooPhi для моделирования астрофизических течений с использованием новейших ускорителей Intel Xeon Phi с архитектурой KNL. В рамках статьи мы рассмотрим астрофизическое явление: галактику типа медуза. Известно, что основные сценарии образования таких объектов основаны на механизме набегающего давления межгалактического газа или галактического ветра, создаваемого активным ядром галактики. Однако, механизм набегающего давления может быть получен в результате столкновения га­лактик различной массы. Такой сценарий и был исследован в настоящей работе с помощью разработанного кода. Подробно описан новый векторный численный метод, реализованный в виде программного кода для массивно-параллельных архитектур. Для решения гидродинами­ческих уравнений используется модификация оригинального численного метода, основанного на комбинации метода разделения операторов, метода Годунова и HLL схемы. Такой метод объединяет все достоинства перечисленных методов и обладает высокой степенью параллелизации. В основе параллельной реализации лежит многоуровневая декомпозиция вычислений. На первом уровне используется геометрическая декомпозиция расчетной области с помощью библиотеки MPI. На втором уровне происходит декомпозиция вычислений между потоками ускорителя Intel Xeon Phi с помощью библиотеки ОрепМР. В рамках каждого потока происхо­дит векторизация вычислений средствами AVX512. Стоит отметить, что конструкция числен­ного метода допускает все виды декомпозиции вычислений. Приведены результаты верифика­ции численного метода на трех тестах Годунова и на задаче Седова о точечном взрыве. Целью первого теста является определение правильности описания контактного разрыва. Большин­ство методов решения газодинамических уравнений дает либо осцилляцию, либо диффузию («размазывание ударных волн). Авторский метод  дает размазывание ударной волны, в то же время корректно воспроизводит местоположение ударной волны, контактного разрыва и формы волны разрежения. В ходе второго теста, газ с одинаковыми термодинамическими параметрами разлетается в разные стороны, образуя в центре существенную область разреже­ния. Тест выявляет способность физически правдоподобно моделировать такую ситуацию. Из литературы известно, что многие методы дают ошибочный (нефизический) рост температуры в области сильного разрежения, и, как следствие, получаемое решение искажается. Авторский метод успешно моделирует область разрежения.
Основная задача третьего теста — проверка устойчивости численного метода. Огромный пере­пад давления (5 десятичных порядков) должен выявить способность метода устойчиво моде­лировать сильные возмущения с возникновением быстро распространяющихся ударных волн. Авторский метод успешно моделирует сильный разрыв. Задача Седова о точечном взрыве является стандартным тестом, проверяющим способность метода и его реализации воспро­изводить сильные ударные волны с большими числами Маха. Авторский численный метод достаточно хорошо воспроизводит положение ударной волны, а также профиль плотности. Подробно описаны детали и исследование параллельной реализации кода. В рамках одного Intel Xeon Phi получена производительность 173 ГигаФлопс и 48-кратное ускорение, при ис­пользовании 16 ускорителей получена 97-процентная масштабируемость. В работе мы рассмот­рели сценарий образования галактик типа медуза на основе столкновения двух карликовых галактик dSph, отличающихся на порядок по массе. Также мы рассмотрели химические про­цессы, происходящие в хвосте галактик с помощью полной системы химических реакций, и сокращенный вариант, допускающие аналитическое решение. Стоит отметить, что асимпто­тики этих решений имеют одну природу. За фронтом массивной галактики образуется хвост, в котором за счет развития неустойчивости типа Кельвина-Гельмгольца развивается аналог турбулентного течения, за счет которого хвост фрагментируется на тентакли, наблюдаемые в галактиках типа медуза. Для характерных значений температуры, а также характерной концентрации атомарного нейтрального водорода в тентаклях с помощью пакета ChemPAK было смоделировано поведение концентрации различных форм водорода, который в подавля­ющей своей части ионизировался, а молекулярный составлял несколько тысячных процента. Очевидно, что процесс образования молекулярного водорода играет меньшую роль, чем про­цессы, приводящие к ионизации водорода. В связи с этим особый интерес представляет собой аналитическое решение процесса ионизации.
 
Исследование выполнено за счет гранта Российского научного фонда (проект 18-11-00044), построение аналитических решений выполнено в рамках бюджетной тематики ИВМиМГ СО РАН 0315^2016-0009.
Ключевые слова: математическое моделирование, вычислительная астрофизика, Intel Xeon Phi.
 
Библиографическая ссылка: журнал Проблемы информатики,  2018, № 2. С.52-74

___________________________________________________________________