Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

К главе 2 и 3 ргр УСК

.pdf
Скачиваний:
4
Добавлен:
15.03.2015
Размер:
1.85 Mб
Скачать

91

Окончательно рейтинг нормализуется и приводится к стобалльной шкале.

Кроме названных систем рейтингования в социальных сетях, следует назвать еще ряд систем.

«SocialSeek – простой, легкий и бесплатный способ мониторинга множества социальных ресурсов в Интернете в режиме реального времени.

Поиск производится в новостях, блогах, Twitter, Facebook, Youtube и др.

Socialpointer – сервис для мониторинга в социальных сетях, новостях,

блогах.

PostRank – мощная перспективная система для глобального социального медиа-анализа, которая позволяет в режиме реального времени анализировать данные по любым темам, тенденциям, событиям, имеющим отношение к вам или вашему бизнесу. В 2011 году данный стартап был куплен Google и на данный момент сервис предлагает два направления. Это,

конечно, же мощнейшая социальная аналитика PostRank Analytics и PostRank Labs.

Twitalyzer – аналитическая программа-клиент для Twitter, позволяющая отслеживать количество переходов, анализирует позитивные и негативные комментарии и настроения и сегментирует аудиторию.

Trackur – платный онлайн-инструмент для основательного мониторинга и анализа социальных медиа1».

Следует отметить, что алгоритмы оценки влияния в социальных сетях являются для всех названных систем закрытыми и о них можно только догадываться, поэтому в настоящем параграфе предложим авторскую модель оценки влияния в социальных сетях. Предлагаемая модель будет экспертно-

стохастической. Это объясняется тем, что она будет базироваться на предварительной экспертной оценке значимости учитываемых показателей влияния и экспертной обработке (в случае необходимости) данных мониторинга Интернет-ресурсов и дальнейшей их обработке методами

1 19 сервисов для эффективного мониторинга социальных медиа // http://soft.rabotaka.ru/2011/12/19.html#.U7lEJGAhMUs

92

математической статистики и теории вероятностей.

Будем оценку влияния в социальной сети проводить по k показателям,

в рамках системы Klout это следующие показатели:

«Amplification – зона вашего влияния, то есть сколько пользователей отвечает на ваш пост или ретранслирует его;

True Reach – количество людей, на которых вы оказываете влияние;

Network Score – оценка реакции вашей аудитории на ваше влияние, т.е.

как часто ваши подписчики, друзья (или их друзья) делятся вашими записями со своими подписчиками, друзьями и, соответственно, как далеко расходится по сети этот контент1».

Одним из наиболее распространенных подходов к нахождению комплексных интегральных оценок, в том числе и оценок влияния в социальных сетях или рейтинга является подход, базирующийся на линейной свертке учитываемых показателей с соответствующими весовыми коэффициентами (весами, значимостями, важностями и др.). В результате интегральная оценка в виде линейного функционала:

k

 

 

V = vk jPj

,

(2.3.1)

j=1

где V – интегральная оценка влияния агента в социальной сети; k – количество учитываемых отдельных (частных) показателей; vkj– весовой коэффициент отдельного (частного) показателя;

Pj – показатель (частный) влияния; j = 1, 2, …, k.

Рассмотрим ряд случаев оценки влияния агентов в социальной сети при различной информации о параметрах модели (2.3.1):

1 Социальный рейтинг Klout.com// http://www.rusfet.com/2011/12/socialnyj-rejting-klout.html

93

«1. Весовые коэффициенты и показатели рассматриваются как

детерминированные величины.

2.Весовые коэффициенты рассматриваются как детерминированные величины, а показатели рассматриваются как случайные величины.

3.Весовые коэффициенты рассматриваются как случайные величины, а

показатели рассматриваются как детерминированные величины.

4.Весовые коэффициенты и показатели рассматриваются как случайные величины1».

Наибольший интерес представляют ситуации два – четыре. Рассмотрим наиболее сложный случай оценки влияния в социальной сети – четвертый.

Далее будем использовать методический инструментарий стохастического доминирования, разработанный в работах Ломакина М.И. и

его учеников, для оценки влияния в социальных сетях, в частности, для разработки экспертно-стохастической модели оценки влияния в социальных сетях2.

Для этой ситуации информация о показателях, характеризующих влияние, представлена выборками дискретных случайных величин таких как: 1) зона влияния агента (группы агентов), т.е. сколько пользователей отвечает на пост агента (группы агентов) или ретранслирует его; 2) количество людей,

на которых агент (группа агентов) оказывает влияние; 3) реакция аудитории агента (группы агентов) на его влияние, т.е. как часто подписчики, друзья агента (или их друзья) делятся его записями со своими подписчиками,

друзьями и, соответственно, как далеко расходится по сети этот контент. При этом объем этих выборок различен.

Интегральный показатель влияния вида (2.3.1) является дискретной случайной величиной и, следовательно, влияние в социальной сети может быть оценено с помощью различных характеристик дискретной случайной

1 Ломакин М.И. Оценки показателей качества по малым выборкам // Экономические и информационные аспекты технического регулирования и стандартизации. – 2011. – № 1.

2 Ломакин М.И., Коновалов В.А. Модель оптимальной реализации аутсорсинговых резервов качества ИТ-услуг // Транспортное дело России, 2012. – № 6.

94

величины таких как: вероятности различных событий, математические ожидания, дисперсии и др. Задача интегральной оценки влияния здесь тождественна задаче определения характеристик специфических дискретных случайных величин. В нашем распоряжении нет полной информации о характере распределения этих специфических дискретных величин, поэтому целесообразно перейти к задаче определения гарантированных оценок влияния в социальной сети.

Рассмотрим наиболее общий четвертый вариант – вариант, когда весовые коэффициенты и показатели качества рассматриваются как случайные величины.

Пусть весовые коэффициенты vkj представлены выборками vkjv= (vkj1, vkj2,…, vkjs) (s > 1) из некоторого неизвестного дискретного распределения

G(t), возможные значения этих случайных величин соответствуют значениям

0, 0,1, 0,2,…,1,0 (шаг дискредитации может быть более мелким); оценки показателей Pj представлены выборками Pjv= (pj1, pj2,…,pjl) (l> 1) из некоторого неизвестного дискретного распределения F(t), возможные значения этих случайных величин соответствуют значениям 1, 2, 3, 4, 5.

Значения vkij>0 выборки vkiv рассматриваем как независимые одинаково распределенные величины из неизвестного дискретного распределения, которое принадлежит множеству G1i всех возможных распределений Gi(t), из которых могла быть получена выборка αiv, т.е.

множество G1i определим в виде:

G1i {Gi (t) : Gi 1 ( i ) vkij}

. (2.3.2)

Запись Gi-1i) = vkij следует понимать как решение уравнения Gi(vkij) =

ξi относительно vkij. В данном уравнении ξi – реализация случайной величины, равномерно распределенной на интервале [0,1].

95

Значения pij > 0 выборки Piv рассматриваем как независимые одинаково распределенные величины из неизвестного дискретного распределения,

которое принадлежит множеству F1iвсех возможных распределений Fi(t), из которых могла быть получена выборка piv, т.е. множество F1i определим в виде:

F

{F (t) : F

1(

) p

}.

(2.3.3)

1i

i

i

i

ij

 

 

Запись Fi-1i) = pij следует понимать как решение уравнения Fi(tij) = ξi

относительно pij. В данном уравнении ξi – реализация случайной величины,

равномерно распределенной на интервале [0,1].

Наиболее общими характеристиками случайных величин являются вероятности различных событий, поэтому целесообразно в качестве основной характеристики интегрального влияния в социальной сети рассматривать вероятность того, что интегральный показатель влияния не ниже заданного уровня. Вследствие того, что, как правило, в нашем распоряжении имеются неполные данные, представленные соответствующими выборками, то следует находить гарантированную оценку этой вероятности на множестве всех распределений G1 и F1, т.е.

задача состоит в том, чтобы найти:

OVx

min

P(V V0 ) ,

(2.3.4)

 

Fi (t) F1i ,Gi (t) G1i ;1 1,...,k

 

 

OVx

max

P(V V ) .

(2.3.5)

 

Fi (t) F1i ,Gi (t) G1i ;1 1,...,k

0

 

 

 

 

Впоследних соотношениях OVx, OVx – нижняя и верхняя

(гарантированные) оценки влияния в социальных сетях на множестве

распределений G1 и F1;

96

Р(V ≥ V0) – вероятность того, что интегральный комплексный влияния не ниже заданного уровня V0.

Определим для каждого показателя влияния Pi и для каждого весового коэффициента vki первые (два) выборочные моменты и дисперсии по соотношениям:

 

 

1

w

 

mip

zijp ,

(2.3.6)

 

 

 

 

 

w j 1

 

 

1

 

w

 

Di

 

(zij mi1 )2 ,

(2.3.7)

 

 

 

w 1 j 1

 

где mip – выборочные моменты и Di дисперсии показателей влияния и весовых коэффициентов; zij – значения из выборок vkiv и Piv соответственно.

От выборочных моментов показателей влияния и их весовых коэффициентов перейдем к моментам интегрального показателя влияния в соответствии с соотношениями:

 

 

k

 

m1 m j1{vk}m j1{P},

(2.3.8)

 

 

j 1

 

k

 

 

 

D (Dj{vk}Dj{P} m2j1{vk}Dj{P} m2j1{vk}Dj{P}) ,

(2.3.9)

j 1

 

 

 

m

2

D m2

(2.3.10)

 

1 .

 

В последних соотношениях m1 – первый момент интегрального показателя влияния;

m2 – второй момент интегрального показателя влияния;

97

mj1{vk}, Dj{vk} – первые моменты и дисперсии весовых коэффициентов;

mj1{P}, Dj{P} – первые моменты и дисперсии показателей влияния.

Определим множество R0 как множество дискретных функций распределения R(t), у которых первые два момента равны выборочным двум моментам m1, m2 в следующем виде:

L

 

R 0 {R(t) : p jtlj ml ;l 1,2} .

(2.3.11)

j 1

Здесь ti – точка роста дискретного распределения; L – количество возможных значений (точек роста) дискретной случайной величины V.

Вместо задач определения гарантированной величины интегрального показателя влияния, определяемых соотношениями (2.3.4) и (2.3.5)

переходим к следующей задачам. Найти:

OVx

min P(V V0 ) ,

(2.3.12)

 

R (t) R0

 

OVx max P(V V0 ) .

(2.3.13)

 

R (t) R0

 

Распределение случайной величины V принадлежит множеству функций распределения дискретных случайных величин с известными возможными значениями (точками роста) ti и заданными моментами m1, m2.

Это позволяет перейти к задаче определения нижней оценки показателя качества: найти на множестве дискретных функций распределения с заданными первыми моментами нижнюю оценку (границу) вероятности P(V ≥ V0), т.е. найти:

 

OV

 

OVx min

(1 0 p j )

(2.3.14)

R (t ) R 0

j 1

 

98

или в развернутом виде – найти такие неотрицательные величины pj,

что:

V0

 

 

p j max;

(2.3.15)

j 1

 

L

 

 

p j 1;

(2.3.16)

j 1

 

L

 

 

p jt j

m1 ;

(2.3.17)

j 1

 

L

 

 

p jt2j

m2 ;

(2.3.18)

j 1

 

pj 0,

j 1,2,...,L.

(2.3.19)

Задача, определяемая соотношениями (2.3.15) – (2.3.19), относится к классу задач линейного программирования. Для ее решения могут быть использованы стандартные пакеты программ решения задач линейного программирования.

Задача определения верхней оценки показателя качества формулируется аналогично: найти на множестве дискретных функций распределения с заданными первыми моментами верхнюю с заданными первыми моментами верхнюю оценку (границу) вероятности P(V ≥ V0), т.е.

найти:

 

 

OV

 

OVx

max (1 0 p j )

(2.3.20)

 

R (t ) R 0

j 1

 

или в развернутом виде – найти такие неотрицательные величины pj,

что:

V0

 

p j min;

(2.3.21)

j 1

 

99

 

L

 

 

p j 1;

(2.3.22)

j 1

 

L

 

 

p jt j

m1 ;

(2.3.23)

j 1

 

L

 

 

p jt2j

m2 ;

(2.3.24)

j 1

 

pj 0,

j 1,2,...,L.

(2.3.25)

Данная задача также относится к классу задач линейного программирования. Для ее решения могут быть использованы стандартные пакеты программ решения задач линейного программирования.

Таким образом, могут быть найдены гарантированные (нижние и верхние) оценки интегрального показателя влияния в социальных сетях. В

итоге получаем интервальную оценку интегрального показателя влияния.

Для перехода к точечной оценке будем использовать критерий пессимизма – оптимизма Гурвица1. В конечном итоге может быть использовано соотношение:

VOт = λVOx + (1 – λ)VOx,

(2.3.26)

где коэффициент λ (0 ≤ λ ≤ 1) характеризует меру оптимизма при определении интегральной оценки влияния в социальной сети. При λ = 0

получаем консервативную оценку, соответствующую нижней интегральной оценке влияния, при λ = 1 получаем оптимистичную оценку,

соответствующую верхней интегральной оценке влияния в социальных сетях.

Существуют различные рекомендации при выборе коэффициента λ, не рассматривая их, отметим, что в случае отсутствия сильно выраженной склонности к пессимизму или оптимизму, целесообразным представляется

1 Вентцель Е.С. Теория вероятностей. – М.: Наука, 1969.

100

выбор коэффициента λ равным 0,5. Более осторожный выбор коэффициента λ может быть выполнен с помощью «правила золотого сечения», в этом случае

λ = 0,382. Далее при определении точечной интегральной оценки влияния предпочтительно использовать именно это значение. Тогда соотношение

(2.3.26) можно переписать в виде:

VOт = 0,382 VOx + 0,618 VOx,

(2.3.27)

Последнее соотношение позволяет интегральную (точечную) оценку влияния любого агента в социальных сетях, при этом в этом соотношении может быть использовано любое число показателей (первичных показателей)

влияния. Интегральная оценка влияния получена в шкале измерения вероятностей, т.е. в шкале от 0 до 1, при желании (необходимости) она может быть переведена в любую другую шкалу, например от 0 до 100 путем умножения на 100 и округления до целых значений.