Учебное пособие 2036
.pdfy1 a12y2 a13y3 a14y4 a1k yk b11x1 b12x2 b13x3 b1mxm 1, |
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||
y |
2 |
a |
y a |
23 |
y |
3 |
a |
24 |
|
y |
4 |
a |
2k |
y |
k |
b x b |
x b |
x b |
|
x |
m |
|
2 |
, |
|
|
|||||||||||||||||
|
|
21 1 |
|
|
|
|
|
|
|
|
21 1 |
22 2 |
23 3 |
|
2m |
|
|
|
|
|
|
|
|
|
|||||||||||||||||||
y a |
y a |
32 |
y |
2 |
a |
34 |
y |
4 |
a |
3k |
y |
k |
b x b x |
2 |
b x b |
x |
m |
|
3 |
, |
|
|
|||||||||||||||||||||
|
3 |
31 1 |
|
|
|
|
|
|
|
31 1 |
32 |
|
33 3 |
|
3m |
|
|
|
|
|
|
|
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
a |
y a |
|
y |
|
a |
|
|
y |
|
a |
|
|
|
|
y |
|
b x b |
x b |
x b |
|
x |
|
|
|
|
|
|
, |
|||||||||||||
y |
k |
k2 |
2 |
k3 |
3 |
k,k 1 |
k 1 |
|
m |
|
k |
||||||||||||||||||||||||||||||||
|
|
k1 1 |
|
|
|
|
|
|
|
|
|
|
k1 1 |
|
k2 2 |
k3 3 |
|
|
|
|
km |
|
|
|
|
где yi – эндогенные переменные СФМ, 2 i k n ; xj – предопредел нные переменные СФМ, 1 j m n; εi – остатки, удовлетворяющие условиям применимости метода наименьших квадратов (МНК), 2 i k n .
Поставим в соответствие СФМ привед нную форму модели (ПФМ):
y1 11x1 12x2 13x3 1mxm 1,
y2 21x1 22x2 23x3 2mxm 2,
yk k1x1 k2x2 k3x3 kmxm k ,
где δi – остатки, удовлетворяющие условиям применимости МНК,
2 i k n .
Регрессионные значения эндогенных переменных
~y1 11x1 12x2 13x3 1mxm,
~y2 21x1 22x2 23x3 2mxm,
~yk k1x1 k2x2 k3x3 kmxm,
полученные МНК-идентификацией независимых уравнений ПФМ, применим в косвенном МНК. Для этого заменим выборочные значения yi их регрессионными значениями ~yi в каждом уравнении СФМ:
~y1 a12~y2 a13~y3 a14~y4 a1k ~yk b11x1 b12x2 b13x3 b1mxm,~y2 a21~y1 a23~y3 a24~y4 a2k ~yk b21x1 b22x2 b23x3 b2mxm,
~yk ak1~y1 ak2~y2 ak3~y3 ak,k 1~yk 1 bk1x1 bk2x2 bk3x3 bkmxm.
Добавив aii:=0, получим из i-го уравнения, i 1,k, тождество по xj, j 1,m:
i1x1 i2x2 imxm ai1 11x1 12x2 1mxm ai2 11x1 12x2 1mxmaik 11x1 12x2 1mxm bi1x1 bi2x2 bimxm.
Для выполнения тождества достаточно, чтобы соответствующие структурные коэффициенты удовлетворяли линейной неоднородной системе m уравнений с неизвестными структурными коэффициентами aij при эндогенных и неизвестными структурными коэффициентами bij при предопредел нных переменных:
i1 11ai1 21ai2 k1aik bi1, |
|
|
11ai1 21ai2 k1aik |
|
i1 bi1, |
|
||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
a |
|
|
|
|
|
a |
|
|
|
|
|
a |
|
b |
, |
|
|
|
a |
|
|
|
|
|
a |
|
|
|
|
|
a |
|
|
|
|
|
|
b |
, |
||||||||
|
12 |
i1 |
22 |
i2 |
k |
2 |
ik |
|
|
12 |
i1 |
22 |
i2 |
k2 |
ik |
|
i2 |
|||||||||||||||||||||||||||||||||||
|
i2 |
|
|
|
|
|
|
|
|
|
|
i2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
i2 |
|
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1m |
a |
i1 |
|
2m |
a |
i2 |
|
km |
a |
ik |
b , |
|
|
|
|
a |
i1 |
|
2m |
a |
i2 |
|
km |
a |
ik |
|
im |
b . |
||||||||||||||||||||||
|
im |
|
|
|
|
|
|
|
|
|
|
im |
|
1m |
|
|
|
|
|
|
|
|
|
|
|
im |
100
По крайней мере один из структурных коэффициентов (aii:=0) фиксирован, то есть не требует идентификации. Некоторые другие структурные коэффициенты также фиксируются (например, обнуляются, если вклад соответствующей переменной xj или yj в i-е уравнение СФМ незначим). Возможны и другие ограничения на структурные коэффициенты, например их равенство, функциональная связь и т.п. Рассмотрим два случая.
Случай 1. Если среди неизвестных коэффициентов bim нет заданных, то при произвольных значениях aij можно взять
|
bi1 : i1 11ai1 21ai2 k1aik , |
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||
|
|
|
: |
|
|
|
|
|
a |
|
|
|
|
a |
|
|
|
a |
|
|
, |
|
|
|
|
|
|
|
|||||||||
|
b |
2 |
i |
2 |
12 |
i1 |
22 |
i2 |
k2 |
ik |
|
|
|
|
|
|
|
||||||||||||||||||||
|
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
bim : im 1mai1 2mai2 kmaik . |
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||
В этом случае i-е уравнение СФМ не идентифицируемо по заданным |
|||||||||||||||||||||||||||||||||||||
выборочным наблюдениям. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Случай |
2. Пусть |
|
mi |
|
|
|
|
неизвестных |
|
|
|
коэффициентов bij |
|
при |
|||||||||||||||||||||||
|
1,m |
|
|
|
|
|
|||||||||||||||||||||||||||||||
предопредел нных переменных i-го |
|
уравнения |
|
СФМ с индексами |
j |
|
|
|
|
||||||||||||||||||||||||||||
|
|
1,mi |
|||||||||||||||||||||||||||||||||||
заданы (например, нулевые), а остальные m–mi |
0 – произвольны. |
|
|
|
|
|
|
||||||||||||||||||||||||||||||
Тогда подсистема |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
11ai1 21ai2 k1aik i1 bi1, |
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||
|
|
|
a |
|
|
a |
|
|
|
|
a |
|
b |
|
, |
|
|
|
|
|
|
|
|
||||||||||||||
|
|
12 |
|
|
k2 |
i2 |
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||
|
|
|
i1 |
|
|
|
22 i2 |
|
|
|
|
|
|
ik |
|
|
|
i2 |
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
a |
|
|
|
|
|
a |
|
|
|
|
|
a |
|
|
|
|
|
b , |
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
i2 |
kmi |
|
imi |
|
|
|
|
|
|
|
|||||||||||||||||||||
|
|
1mi |
i1 |
|
|
|
2mi |
|
|
|
|
|
|
ik |
|
|
|
|
|
|
imi |
|
|
|
|
|
|
|
|||||||||
является системой линейных алгебраических уравнений (СЛАУ), в |
|||||||||||||||||||||||||||||||||||||
которой число |
уравнений |
mi |
|
m |
|
может |
|
не |
совпадать с |
числом |
ki |
|
|
|
|||||||||||||||||||||||
|
|
|
1,k |
||||||||||||||||||||||||||||||||||
неизвестных |
структурных |
|
|
|
коэффициентов |
|
aij |
|
|
|
k 1 . |
Следвательно, |
структурные коэффициенты i-го уравнения СФМ точно идентифицируются по привед нным коэффициентам ПФМ, если имеет единственное решение неоднородная СЛАУ
11ai1 21ai2 |
k |
1aik |
i1 bi1 |
k |
1,1ai,k |
1 k1aik, |
|
||||||||||||||||||||||||
|
a |
|
|
a |
|
i |
|
a |
i |
|
|
|
b |
|
i |
|
|
a |
i |
|
|
|
|
a , |
|||||||
|
|
|
ik |
|
i2 |
|
|
k |
|
i,k |
1 |
||||||||||||||||||||
|
12 |
i1 |
|
|
22 i2 |
|
|
k |
|
2 |
|
|
|
i2 |
|
1,2 |
|
|
k2 ik |
|
|||||||||||
|
|
|
|
|
|
|
|
|
i |
|
|
i |
|
|
|
|
|
|
|
i |
|
|
|
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
a |
|
|
a |
|
|
|
a |
|
|
b |
|
|
|
|
|
|
a |
|
a . |
||||||||||
|
1mi |
|
i2 |
|
imi |
|
ki 1,mi |
||||||||||||||||||||||||
|
i1 |
|
|
2mi |
|
|
|
|
kimi |
|
iki |
|
|
|
imi |
|
|
i,ki 1 |
|
|
kmi ik |
Здесь в правую часть перенесены все слагаемые со структурными коэффициентами aij, не требующими идентификации (например, нулевыми). Эта СЛАУ имеет единственное решение тогда и только тогда, когда mi=ki и составленная из выборочных МНК-оценок привед нных коэффициентов матрица системы
101
|
|
|
21 |
|
ki1 |
|
|
11 |
|
|
|
||
12 |
22 |
ki2 |
||||
Ai : |
|
|
|
|
||
|
|
|||||
|
1ki |
2ki |
|
|
|
|
|
kiki |
не вырождена.
Если mi=m, то задача выборочной идентификации параметров i-го уравнения СФМ решена. Если же mi<m, то подставив найденные решения в подсистему остальных (m–mi) уравнений СЛАУ
1,m 1ai1 2,m 1ai2 |
k,m 1aik |
i,m 1 bi,m 1, |
||||||||||||||
|
i |
|
|
|
|
|
i |
|
|
|
|
i |
|
|
i |
i |
1,m 2ai1 |
2,m 2ai2 |
k,m 2aik |
i,m 2 |
bi,m 2, |
||||||||||||
|
i |
|
|
|
|
|
i |
|
|
|
|
|
i |
|
i |
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
a |
i1 |
|
2m |
a |
i2 |
|
|
km |
a |
ik |
|
im |
b , |
|
|
1m |
|
|
|
|
|
|
|
im |
|
однозначно идентифицируем оставшиеся структурные коэффициенты:
bi,mi 1 : i,mi 1 1,mi 1ai1 2,mi 1ai2 k,mi 1aik ,
bi,mi 2 : i,mi 2 1,mi 2ai1 2,mi 2ai2 k,mi 2aik ,
bim : im 1mai1 2mai2 kmaik .
Таким образом, i-е уравнение СФМ точно идентифицируемо при mi=ki и detAi 0. [3]
Повторяя рассуждения для всех уравнений СФМ, получим решение выборочной идентификации параметров СФМ. Таким образом, наличие дополнительных функциональных зависимостей между идентифицируемыми параметрами СФМ может быть единообразно учтено в задачах выборочной оценки параметров систем линейных регрессий.
Литература
1.Котенко А.П. Особенности применения косвенного метода наименьших квадратов к системе независимых эконометрических уравнений // Друкеровский вестник, 2017, №3. – Новочеркасск: Изд-во ЮРГПУ, 2017. – С.96-102.
2.Котенко А.П., Котенко А.А. Использование идентифицируемых систем
эконометрических уравнений / Математика, статистика, информ. технологии в экономике, управлении и образовании: сб. тр. 5й Международной научно-практ. конференции (31.05.2016, Тверь), ч.1. – Тверь: Изд-во Тверского гос. ун-та, 2016. – С.51-55.
5.Котенко А.П., Букаренко М.Б. Геометрия систем линейных регрессионных уравнений // Известия Самарского научного центра РАН, т.15, №6(3). – Самара: Изд-во Самарского научного центра РАН, 2013. – С.820-823.
ФГБОУ ВО «Самарский государственный технический университет», Россия
102
УДК 004.42
О.Б. Кремер, М.С. Папилина
РАЗРАБОТКА ИНФОРМАЦИОННО-СПРАВОЧНОЙ СИСТЕМЫ «ИНТЕРАКТИВНАЯ АФИША ВОРОНЕЖА» НА ОСНОВЕ WEB-ТЕХНОЛОГИЙ
В настоящее время информационные технологии используются во всех сферах жизнедеятельности человека, в том числе и в организации досуга. В Интернете существуют ресурсы, позволяющие просматривать афишу мероприятий. Пользователь может найти интересующее его событие по названию, дате, категории и месту проведения мероприятия. Но в качестве параметра поиска обычно не используют время работы и территориальное расположение, что имеет весомое значение для гостей города.
Одной из распространенных компьютерных технологий является информационная система. Информационная система – это совокупность средств, способов и методов, направленных на создание, сбор, хранение, анализ, обработку и передачу информации, а также совокупность функциональных процессов и связанных с ними информационных, специфичных в конкретной области [1].
Также к популярным информационным технологиям, доступным большинству компьютерных пользователей, можно отнести Интернеттехнологии. Интернет-технологии или Web-технологии – это коммуникационные, информационные и иные технологии создания и поддержки различных информационных ресурсов в сети Интернет [2].
У любой информационной системы есть главная задача - поиск информации. Производительность информационно-справочной системы (ИСС) зависит от скорости и возможностей разносторонней выборки необходимых данных из большого массива для внутренней работы с данными.
Поэтому разработка информационно-справочной системы "Интерактивная афиша Воронежа" на основе Web-технологий является актуальной.
Целью разработки является проектирование ИСС «Интерактивная афиша Воронежа», структурирование информации для создания базы данных (БД) с информацией о развлекательных мероприятиях, организация интерфейса пользователя в виде Web-страниц, реализация формирования запроса к БД и выдачи пользователю результатов поиска.
Одной из задач, требующей решение для достижения цели, является выбор программных средств разработки.
Рассмотрим особенности языков программирования Python и C#.
Python – интерпретируемый язык программирования, который имеет широкую сферу применения в различных предметных областях [3].
К достоинствам языка можно отнести качество программного обеспечения, поскольку данный язык имеет удобный синтаксис и лаконичный
103
подход к написанию кода, а также обладает современными инструментальными средствами многократного применения программного кода, каким является объектно-ориентированное программирование (ООП).
Высокая скорость разработки достигается за счет простого синтаксиса, динамической типизации, отсутствия пункта компиляции и внутренних инструментальных средств, позволяющих разрабатывать приложения за меньшее время.
Кроссплатформенность - переносимость программ из одной операционной системы (ОС) в другую. Python обладает инструментальными средствами для разработки переносимых графических интерфейсов, приложений доступа к БД, веб-приложений, интерфейсов ОС и других типов программ.
Недостатком языка является скорость выполнения программ, по сравнению с программами, написанными на компилируемых языках программирования.
В языке предусмотрены интерфейсы обращения к таким реляционным базам данных, как PostgreSQL, MySQL, Oracle, Sybase, SQLite. Предусмотрен также переносимый прикладной программный интерфейс БД, который стандартизирует доступ к разным БД из сценариев на данном языке.
Язык программирования С# – универсальный и мощный компилируемый язык программирования, который является одной из составных частей платформы .NET, который можно использовать для создания и вебприложений.
C# используется для написания программ, выполняющихся в ОС Windows, т.к. поддерживается компанией Microsoft, но может использоваться и для других ОС. C# представляет собой объектно-ориентированный язык, с возможностью компонентно-ориентированного программирования.
Независимые программные компоненты, которые служат для реализации определенных функциональных возможностей, представляют собой определенную модель программирования, в состав которой входят свойства, методы и события. Каждый компонент характеризуется своим атрибутом и элементом документации. C# подходит для создания различных программных компонентов благодаря встроенным языковым конструкциям [4].
К основным функциональным возможностям языка относятся:
–совместимость приложений и библиотек разных версий языка;
–расширенная служба выявления и обработки ошибок;
–сборка мусора (автоматическое управление памятью), т.е. очищает память, занятую удаленными и неиспользуемыми объектами;
–строгая типизация языка предотвращает обращение к неинициализированным переменным, выход за пределы индексируемых массивов или неконтролируемое приведение типов;
–встроенная поддержка автоматической генерации XML-документации;
–формальные синтаксические конструкции для классов, интерфейсов, структур, перечислений и делегатов;
104
–возможность перегрузки операторов для пользовательских типов;
–создание обобщенных типов и обобщенных элементов-членов;
–поддержка анонимных методов для применения типа делегата;
–поддержка анонимных типов, предназначенных для моделирования формы типа, а не его поведения.
Разработка веб-приложений доступна благодаря технологии ASP.NET. Эта технология доступна на платформе .NET для разработки динамических вебприложений, она предоставляет управляемую событиями модель программирования, которая облегчает разработку веб-страниц. В состав ASP.NET входят различные элементы пользовательского интерфейса (таблицы, сетки, календари), благодаря чему упрощается работа разработчика.
Сравним рассмотренные выше языки программирования (табл. 1).
|
|
Таблица 1 |
Сравнение языков программирования |
||
Параметр |
C# |
Python |
Парадигма |
Объектно- |
Объектно- |
|
ориентированная |
ориентированная, |
|
|
функциональная |
Типизация |
Статическая, |
Динамическая |
|
динамическая |
|
Управление памятью |
Ручное управление, |
Сборка мусора |
|
сборка мусора |
|
Объектно- |
Интерфейсы |
Интерфейсы, Mixins, |
ориентированные |
|
множественное |
возможности |
|
наследование |
Функциональные |
Функция является |
Функция является |
возможности |
объектом первого класса, |
объектом первого класса, |
|
анонимные функции, |
лексическое замыкание, |
|
лексическое замыкание, |
каррирование, частичное |
|
каррирование |
применение |
Тип транслятора |
Компилятор |
Интерпретатор |
Для решения поставленной в работе задачи выбран язык C#.
Рассмотрим системы управления базами данных (СУБД) для реализации БД разрабатываемой системы.
Microsoft SQL Server – это СУБД, движок которой работает на облачных серверах и локальных серверах с возможностью использовать эти типы серверов одновременно. Данная СУБД содержит компонент Database Engine,
средства анализа Analysis Services, средства отчетов Reporting Services,
интеграционные службы Integration Services и надстройку SQLXML [5]. PostgreSQL – надежная, быстрая и мощная объектно-реляционная СУБД с
открытым исходным кодом.
105
К ней прилагаются подключаемые модули для разбора запросов на естественном языке, для построения многомерных индексов, для запросов к географическим данным, для создания собственных типов данных. В ней реализованы механизмы обработки транзакций, она позволяет писать хранимые процедуры на различных языках и работает на разных платформах. В PostgreSQL встроена поддержка Unicode, последовательностей, наследования таблиц, подзапросов, а реализация SQL следует стандарту ANSI [6].
Сравним технические характеристики рассмотренных СУБД (таблица 2).
Сравнение СУБД |
Таблица 2 |
||
|
|
||
Параметр |
PostgreSQL |
MS SQL Server |
|
Максимальный размер БД, |
Нет ограничений |
524 272 |
|
Тбайт |
|
||
|
|
|
|
Максимальное количество |
Нет ограничений |
Нет ограничений |
|
записей в таблице |
|
||
|
|
|
|
Максимум полей в записи |
250 - 1600 |
30 000 |
|
Максимум индексов в таблице |
Нет ограничений |
999 |
|
ACID (атомарность, |
|
|
|
согласованность, изоляция, |
Есть |
Есть |
|
долговечность) |
|
|
|
Транзакция |
Есть |
Есть |
|
Unicode |
Есть |
Есть |
|
Индекс выражения |
Есть |
Нет |
|
Частичный индекс |
Есть |
Нет |
|
Пользовательские функции |
Есть |
Есть |
|
Хранимые процедуры |
Есть |
Есть |
|
Для решения поставленной в работе задачи выбрана СУБД MS SQL Server.
Таким образом, в статье рассмотрено решение одной из задач для достижения цели разработки информационно-справочной системы - выбор программных средств разработки. ИСС будет реализована в среде Visual Studio на языке программирования C#, а структурированная информация будет представлена в виде базы данных в СУБД MS SQL Server.
Литература
1.Жданов С.А. Информационные системы. Учебник для ВУЗов / С.А. Жданов, М.Л. Соболева, А.С. Алфимова. – М.: ООО «Прометей», 2015. – 302 с.
2.Государство. Бизнес. ИТ. – Электрон. дан. – Режим доступа: http://www.tadviser.ru/index.php/Статья:Интернет-технологии
106
3.Лутц М.Изучаем Python / Марк Лутц. – 4-е изд. – Пер. с англ. – СПб.:
Символ-полюс, 2013. – 1280 с.
4.Джепикс Ф. Язык программирования C# 7 и платформы .NET и .NET Core / Ф. Джепикс, Э. Троелсен. – 8-е изд. – М.: Вильямс, 2018. – 1328 с.
5.Петкович Д.Microsoft SQL Server 2012. Руководство для начинающих: Пер. с англ. / Д. Петкович. — СПб.: БХВ-Петербург, 2014. — 816 с.
6.Редмонд Э.Семь баз данных за семь недель. Введение в современные базы данных и идеологию NoSQL / Э. Редмонд, Д. Р. Уилсон; под ред. Ж. Картер. - пер. с англ. Слинкин А. А. – М.: ДМК Пресс, 2013. – 384с.
ФГБОУ ВО «Воронежский государственный технический университет», Россия
УДК 004.942.001.57
В.Н. Ланцов, И.А. Никитов
ТЕНЗОРЫ ДЛЯ ОБРАБОТКИ ИНФОРМАЦИИ И САПР
Достижения в последние годы в области методов декомпозиции (разложении) тензоров, разработка большого числа программных продуктов, реализующих работу с тензорами, позволили значительно сократить память для хранения высоко размерных задач и сократить вычислительные затраты [1, обз].
Так в статье [2] был представлен метод расчета нелинейных схем с применением алгоритмов понижения порядка моделей на основе тензорного анализа, который позволил использовать нелинейности более высокого порядка, получена более высокая точность при сокращении времени расчета и сокращении необходимой памяти ЭВМ. В работе [3] представлена тензорная теория как основа для САПР при решении проблем высокой размерности (с большим числом неизвестных). В работе [4] указывается, что использование «Больших Данных» (Big Dates) требует разработки более эффективных средств для работы с данными высокой размерности, особенно полученных с точек множественного доступа. Эти данные в форме многомерного массива обрабатывались ранее классическими методами двухмерных анализов, таких как метод главных компонент (principal component analysis, РСА), на основе сжатия (сокращения), размерностей и матрично-векторного представления. Однако, эти методы не давали большого выигрыш. Поэтому, были предложены методы тензорной декомпозиции для РСА, которые дают значительный выигрыш. В статье приводятся примеры, указывающие, что использование тензорной декомпозиции для моделирования нейронных сетей дает выигрыш по требуемой для хранения памяти в 200 тыс. раз, сокращение времени моделирования от 3 до 10 раз.
Массив с более чем 2-мя размерностями (dimensions) называется тензор. Встречаются следующие эквивалентные определения: тензор с d
107
размерностями ≡ тензор с d модами (modes) ≡ тензор с d направлениями (d way tensor) ≡ тензор порядка d (tensor of order d).
Тензор d-го порядка будем определять как A Rn1 n2 ... nd [5]. Отметим,
что вектор a Rn это тензор 1-го порядка. Матрица A Rn1 n2 это массив данных (тензор) 2-го ранга. Продолжая эту идею для более высоких рангов (d 3), тензор A Rn1 n2 ... nd представляет массив данных d-го порядка. Рис. 1 иллюстрирует пример тензора третьего порядка для 3 4 2 [3].
Рис. 1. Пример тензора третьего ранга (3 4 2 )[3]
Размерность тензора быстро растет с увеличением d, число элементов определяется как nd. Если n = 2, d = 100, то получим 2100 > 1030. Это очень много, что делает практически невозможным использование стандартных подходов.
Методы декомпозиции позволяют аппроксимировать (сжать) высокоразмерный тензор небольшим числом элементов. В результате, можно решать высокоразмерные проблемы с малыми затратами памяти и вычислений
[3].
Каноническая декомпозиция. Каноническая декомпозиция (КД, CANDECOMP/PARAFAC decomposition [2], CPD) аппроксимирует исходный
тензор A Rn1 n2 ... nd |
конечной суммой тензоров первого порядка, что можно |
записать в следующем виде |
|
R |
|
А ar(1) ar(2) |
... ar(d),ar(k) Rnk . |
r 1 |
|
Здесь А(k) [a1(k) ,a2(k) ,...,aR(k) ] Rnk R так называемые факторные матрицы. Иллюстрация метода для тензора третьего порядка приведена на рис. 2 [2].
Рис. 2. Каноническая декомпозиция тензора третьего порядка [2]
108
Декомпозиция Такера (Tucker). Здесь Тензор |
A Rn1 n2 ... nd |
аппроксимируется базовым тензором S Rr1 r2 ... rd и рядом факторных матриц
U Rnk rk [3]
А S 1 U(1) 2 U(2)... d U(d)
Декомпозиция Такера сокращает необходимую память, когда rk значительно меньше nk. Декомпозиция иллюстрируется на рис. 3 [3].
Рис. 3. Декомпозиция Такера преобразование тензора третьего порядка в базовый тензор S и факторные матрицы U Rnk rk [3]
Декомпозиция «тензорного поезда» (Tensor Train Decomposition, ТТ). В данном методе тензор порядка d аппроксимируется двумя тензорами второго порядка (матрицами) и (d − 2) 3-х мерными тензорами, соединенными каскадно
или в виде поезда [3]. Математически элементы |
тензора A Rn1 n2 ... nd |
заменяется как A Gi(11)Gi(22)...Gid(d) . На рис. 4 |
приведен пример ТТ |
декомпозиции для тензора третьего порядка [4]. |
|
Рис. 4. Иллюстрация метода «тензорного поезда», где исходный
G(1),G(d)
трехмерный тензор преобразуется в две матрицы i1 id и трехмерный тензор G(2) [3]
Уравнения модели электронной схемы имеют очень большую размерность, число уравнений (неизвестных) может достигать сотен тысяч и более. Поэтому методы решения таких уравнений относятся к сложным и высоко размерным, что очень удобно для тензорных разложений.
109