1. Описание проблемы

За 2019–2020 годы общественная жизнь в городе подверглась ряду существенных реформ, которые были неоднозначно воспринятыми жителями. В 2020 году власть провела реформу транспортной сети, из-за которой изменилась транспортная инфраструктура города: ликвидированы троллейбусы, изменены автобусные маршруты, внедрена система бесплатных пересадок и оплата картами. В процессе реформации произошел демонтаж железнодорожных путей от станции Пермь I до станции Пермь II. Уже несколько лет ведутся разговоры о строительстве нового зоопарка и гипермаркета «Икеа». Все реформы сопровождаются кадровыми изменениями во властных органах: 6 февраля 2020 года ВРИО губернатора назначен Дмитрий Махонин, который заменил на этом посту Максима Решетникова, руководившего краем в 2017–2020 годы. В декабре 2020 года мэр города Дмитрий Самойлов подал в отставку.

Все изменения в городе влияют на конструирование образа города в социальных медиа, однако восприятие Перми жителями существенно отличается от медийного конструкта. С одной стороны, образ города в сознании жителей непосредственно зависит от медийной повестки, с другой стороны, его формирует собственный опыт восприятия реальности. «Образ города — это семантическая конструкция (система знаков), задающая схема восприятия города, это субъективная система мира» [1]. У жителей конструируется собственное фрейм-понятие «город», которое сочетает в себе определенную структуру знаков: культура, образование, власть, социальные процессы, география и т.д. [3]. К примеру, система образования в Перми состоит из университета, школы, детских садов. В то же время эти знаки можно углубить: школа состоит из учителей, учеников, оценок и т.д.

Восприятие города активно проявляется в речевой деятельности жителей. Социальные сети дают возможность для репрезентации мировоззрения жителей с помощью комментариев. Социальные медиа задают вектор развития диалога, жители реагируют на определенную городскую тему, высказывая свое мнение о городской среде на открытой платформе. Совокупность различных мнений в социальных сетях репрезентирует общественное сознание жителей. Через корпус комментариев можно проследить динамику конструирования образа города в общественном сознании. Цель нашего исследования состоит в анализе содержания и структуры образа города Перми в общественном сознании жителя.

Необходимо отделить данное исследование от пространственного и архитектурного анализа города. Урбанистическая концепция «город как текст», парадигма которой направлена на удобную организацию города и городскую среду, не является концепцией нашего исследования [6], так как «город» в нашем исследовании является образом, который выстраивается в сознании жителя и репрезентируется в виртуальной среде интернета.

2. Подходы к реконструкции образа города

Изучением конструирования образа города занимаются в социологии, культурологии, искусствоведении, маркетинге и лингвистике. Так как исследование опирается на анализ текстового материала, необходимо рассмотреть ряд методик, позволяющих изучить вербальные и когнитивные репрезентации образа города.

Классическое исследование отношений жителей к городу — это качественное интервью горожан в определенной зоне проживания. Можно проследить, как у жителей разных районов выстраивается образ города. К примеру, в исследовании образа города Днепропетровск доминируют метафоры «города-завода», «города-свалки», «города-кошелька» [4]. В качественном интервью можно обстоятельно расспросить человека об его образе города, но такие исследования требуют больших денежных и временных инвестиций. Во время интервью у респондентов проявляется эффект социальной желательности, то есть некоторые опрашиваемые дают ответ, который выглядит предпочтительней в глазах окружающих, тем самым искажается субъективный образ города.

В 2014 году на базе ПГНИУ проходила конференция по конструированию образа территории. Некоторые доклады рассматривали конструирование образа Перми через культурные или маркетинговые маркеры. Анализ общественного образа города Пермь на основе устных спонтанных диалогов проводился в 2019 году. Авторы с помощью технологии «Семограф» составили граф микротем в устных текстах пермяков. Ядерными микротемами выступают темы «места», «географических объектов» и «человека». В статье А.А. Савельева и Д.С. Павлова представлена широкая структура образа города, но не выделены конкретные маркеры, формирующие образ [2]. Неориентированный граф, представленный в статье, поможет нам при выделении и ранжировании тем из корпуса комментариев.

Классические лингвистические исследования образа города подразумевают под собой долгую полевую работу по сбору материала и выявлению структурных единиц. Методика по анализу лингвистического материала из социальных сетей имеет ряд преимуществ перед классическими лингвистическими методиками. Во-первых, посты в социальных сообществах задают разные векторы обсуждения, таким образом, социальные сообщества затрагивают большой спектр городских тем, по которым может высказываться пермяк. Комментарии являются отображением этих тем разными категориями жителей города в соответствии с мировоззрением и родом деятельности. Во-вторых, как отмечается ранее, жители в социальных сетях более раскрепощены, так как отсутствуют рамки эксперимента. Материал отличается не только богатыми лексическими единицами, среди которых обсценная лексика, слэнг, жаргон и т.д., но и наиболее полно раскрывает культуру общения пермяка. В-третьих, акт комментирования дает пользователю время на раздумье, поэтому актор может отобразить наиболее развернутое мнение о проблеме. С другой стороны, исследование социальных сетей требует специального программного обеспечения и знания методов NLP (Nature Language Processing).

В зарубежных исследованиях анализ образа города в социальных сетях широко распространен в компьютерной лингвистике. Такие исследования проводятся для анализа «умных городов», инфраструктурой которых управляет нейронная сеть. Социальной сетью для сбора и анализа материала наиболее часто выступает Twitter, который предоставляет открытый API разработчикам. Ученый из университета Порту собрал 43 миллиона твитов по гео-тегу из 5 разных городов. После их обработки он применил метод «мешка слов», базирующийся на подсчете n-грамм в тексте. На этой выборке он провел тематическое моделирование и классификацию [8]. Его метод исследования лег в основу данного исследования — выявление наиболее частотных n-грамм и их последующая кластеризация. На основе его исследования создали нейронную сеть, которая проводит анализ настроений в Twitter. Нейронная сеть функционирует внутри программного обеспечения «умного города» [5].

Для определения структуры и содержания образа города необходимо извлечь наиболее актуальные темы, спрятанные в значении слова. Методология, описанная в работах ученых из Университета Порту, позволяет наиболее точно определить структуру определенной темы [7]. Ученые предлагают модель для анализа динамики развития темы с помощью сущностных характеристик. Вначале берется корпус твитов, размеченный по дням. Из него извлекаются наиболее частые упоминания, которые в дальнейшем классифицируются по темам. Такая схема описывает динамику изменения определенной темы по дням, в дальнейшем полученные результаты можно визуализировать и автоматизировать. Представленные выше зарубежные методологии по анализу социальных сетей легли в основу данного исследования.

3. Сбор и обработка материала

Социальная сеть VK является одной из наиболее популярных социальных сетей в российском сегменте с ежедневным охватом 43,3% россиян [9]. В связи с большим количеством пользователей социальная сеть удобна для сегментации граждан. Одним из признаков приближенности пользователя к теме является его вступление в сообщество и проявление активности в комментариях. В сообществах определенного города общаются люди, которые находятся в повестке города, имеют свое мнение о нем. Городские сообщества в социальных сетях отличаются различной тематической направленностью:

  • «Подслушано» — сообщества, в которых пользователи предлагают на размещение редактору свои посты. Единственный собственный контент, который размещает автор, — это рекламные объявления. Чаще всего в «подслушано» размещают слухи и неподтвержденные факты, что отображается в названии сообщества. Такие сообщества ведет «народ для народа».
  • Общегородские сообщества напоминают по своей организационной структуре СМИ: есть набор авторов и редакторов, пользователи не ведут это сообщество, но могут общаться в комментариях. Отличие от СМИ заключается в большом разнообразии контента, часто не сфокусированном на новостной повестке. Могут размещаться фотографии, музыка, мнения авторов и т.д.
  • Классическое СМИ — это интернет-издание, анонсирующее свои материалы в социальной сети. Под многими анонсами проходят дискуссии пользователей.

В связи с широким тематическим разнообразием и богатым лексическим материалом для исследования выбрана социальная сеть VK. Для сбора комментариев составлен список ключевых слов, связанных с городом и администрацией: город, Пермь, пермский, улица, район, губернатор, мэр, правительство, местный, пермяк, земляк, Родина, край, Махонин, Решетников, Самойлов. Метод «wall.search» у VK API позволяет собирать комментарии по ключевым словам, но в то же время его движок ограничен последними 2000 записями. Данный метод подходит для изучения динамики развития образа, но не подходит для глобального анализа большого временного периода. Для сбора комментариев использовался парсер «pepper.ninja» — единственный парсер для социальной сети, позволяющий собирать большое количество текстов. Однако он не до конца справился с поставленной задачей: он смог собрать комментарии с 01.08.2019 по 17.04.2020 и с 01.11.2020 по 19.11.2020. За это время собрано 125.403 комментария.

Готовый корпус комментариев прошел предварительную обработку в приложении, написанном на языке Python. Так как лингвистический анализ осуществляется на уникальных комментариях, очистка корпуса от одинаковых вхождений осуществлялась с помощью функции list(set(myList). В дальнейшем предложения разбивались на токены и очищались от стоп-слов. Каждое слово лемматизировалось посредством библиотеки pymorphy2. После первичной обработки размер корпуса составил 1800400 слов. Наиболее частотные леммы отображались в облаке слов (см. рис. 1).

Рис. 1. Облако слов

Гипотеза о том, что в разных типах сообществ обсуждают разные темы, не получила подтверждения, так как во всех сообществах самые частотные слова, по которым не осуществлялся сбор, были одинаковыми. На следующих этапах проводился анализ единого корпуса комментариев.

Следующий этап исследования — это выявление частотных лексем и сочетаний. Он осуществлялся в приложении AntConc. Для упрощения работы приложения была поставлена отсечка в 2 вхождения. Приложение создало список 1-грамм, 2-грамм, 3-грамм и 4-грамм и количество их употреблений, который был выгружен в файл с расширением .xlsx. Для подсчета использовалась методика «мешка слов».

Следующий этап работы — это ручная классификация результатов по полученным тематикам: законодательная власть, исполнительная власть, судебная власть, правонарушения, идеология, транспорт, ЖКХ, культура, наука и образование, экономика, досуг, рынок труда, экология, коронавирус, Пермь, Пермский край, Россия, страны, имена, эмоции. Каждую категорию определяло от 6 до 33 маркеров, связанных с ней. В дальнейшем был проведен семантический анализ полученных n-грамм в каждой теме.

4. Результаты

Помимо частых употреблений словосочетаний с лексемой «Пермь» жители чаще всего говорят о коронавирусе (Крайний мера, 848; сидеть дома, 694), об общественном транспорте (648), отмечают проблему бродячих собак (собака улица, 297; бродячий собака, 286) и говорят о железных дорогах (262). В каждой сфере выделяются следующие биграммы:

  • Исполнительная власть: администрация город (441), наш правительство (361), указ губернатор (278); минздрав пермский (166); департамент транспорт (160);
  • Законодательная власть: местный власть (169), городской власть (112); наш власть (96); пермский власть (84); власть город (83); городской дума (73);
  • Судебная власть: федеральный закон (166); уголовный дело (79); статья конституция (50); уголовный ответственность (42); ст конституция (39);
  • Правонарушения: родиться убить (48); административный правонарушение (42); нарушение режим (35); нарушение правило (29); нарушать закон (25);
  • Идеология: право свобода (108); свобода передвижение (40); свобода человек (40); свобода гражданин (19); свобода слово (17); митинг против (14);
  • Транспорт: общественный транспорт (648); городской транспорт (156); скоростной трамвай (151); транспортный карта (148); городской электричка (134);
  • ЖКХ: бродячий собака (286); железный дорога (262); бездомный собака (225); стая собак (137); дорога город (98);
  • Культура: оперный театр (49); памятник архитектура (34); театр опера (33); белые ночь (23); исторический здание (23);
  • Наука и образование: детский сад (233); ребёнок школа (70); школа город (45); сад школа (43); школа детский (37);
  • Экономика: платный парковка (136); тысяча рубль (131); платить налог (127); бюджетный деньга (108); стоимость проезд (103);
  • Досуг: ледовый городок (233); детский площадка (137); новый зоопарк (72); зоопарк аквапарк (65); бегать улица (62);
  • Рынок труда: человек работать (118); город работать (78); ездить работа (69); ходить работа (67); сотрудник полиция (65);
  • Экология: свежий воздух (179); домашний животное (106); животное улица (89); город деревня (75); дикий животное (64).
  • Коронавирус: носить маска (207); маска перчатка (203); режим самоизоляция (186); улица маска (159); инфекционный больница (125).

Следующие категории – это наиболее частотные имена собственные.

  • Пермь: Набережная (773); Кировский (541); Закамск (522); Кама (425); Свердловский (406);
  • Пермский край: Кунгур (262); Краснокамск (222); Березники (207); Соликамск (134); Чайковский (125);
  • Россия: Москва (3014); Питер (514); Екатеринбург (418); Казань (269); Крым (245);
  • Страны: Китай (430); Италия (348); США (264); Германия (155); Америка (150);
  • Люди: Махонин (1521); Решетников (831); Путин (774); Самойлов (340); Сталин (166).

Наиболее информативный кластер — это эмоциональные высказывания пермяков. В нем собраны оценочные мнения пользователей о городе.

  • Эмоции: любить город (116); город маленький (91); Пермь хороший (90); большой город (89); хороший город (89).

В этом кластере видно, что пермяки называют город хорошим и любят его. Некоторые отмечают, что город большой, другие говорят, что город маленький. Часто встречаются выражения, что город или определенное место в городе красивое. Биграмма «город плохой» употребляется 43 раза, а «самый плохой» 36.

Из полученных результатов можно проследить подробное отношение пермяков к разным сферам жизни. К примеру, можно изучить, как жители относятся к транспорту и реформе. В первую очередь они выделяют преимущество реформы — скоростной трамвай (151) и отмечают внедрение транспортной карты (148). Если смотреть на триграммы, то с повышенной частотой пермяки говорят о министерстве транспорта Пермского края (42), освещают ситуацию с поездами (Поезд дальнего следования, 38), а потом уже городской общественный транспорт (31).

Методика, предложенная в данной статье, дает большой объем информации по разным сферам города и края. Она позволяет собирать «искренние» данные из социальных сетей и интерпретировать их, однако для полноценного анализа образа города надо протестировать ее на других городах. После этого необходимо провести сравнительный анализ результатов и развивать методику. Необходимо автоматизировать извлечение тем и подключить к процессу машинное обучение. В дальнейшем данную технологию можно использовать в политической деятельности для мониторинга реакции пользователей на реформы.

Bibreference

International

Matkin, N.A. (2021) Reconstruction the Image of Perm Based on Comments in Social Media. Culture and technologies studies. Vol. 6, № 1. P. 26-32. Available at:  http://cat.itmo.ru/en/2021/v6-i1/264, DOI: 10.17586/2587-800X-2021-6-1-26-32

Russian GOST 7.0.5 - 2008

Matkin, N.A. Reconstruction the Image of Perm Based on Comments in Social Media [electronic text] // Culture and technologies studies. 2021. Vol.  6. № 1. P. 26-32. URL:  http://cat.itmo.ru/en/2021/v6-i1/264, DOI: 10.17586/2587-800X-2021-6-1-26-32

DOI
10.17586/2587-800X-2021-6-1-26-32
References
  1. Linch K. (1982). Obraz goroda. [The Image of the City]. Moscow. Stroiizdat Publ. 1982. 328 p.
  2. Savel'eva A.A., Pavlova D.S. (2019). Modelirovanie struktury ponyatiya «Gorod» na osnove ustnykh spontannykh dialogov [Modeling Modeling the structure of the concept "City" based on oral spontaneous monologues]. Tret'ya zimnyaya shkola po gumanitarnoi informatike – [The Third Winter School in Humanities and Informatics]. 3-9. Available at: https://www.elibrary.ru/item.asp?id=41472732 (Accessed date: 10/2/2021)
  3. Salimovskii V.A., Mishlanov V.A. (2014). Konstruirovanie obraza gorod na osnove freim-ponyatiya [Construction of an image of a city based on a frame concept] . Lokal'nyi diskurs i konstruirovanie obraza territorii – Tezisy Vserossiiskoi Nauchnoi Konferentsii – [Local discourse and construction of an image of a territory - Abstracts of the All-Russian Scientific Conference]. 28-29.
  4. Chernova L.E., Shelest Yu.R., Ivannikova O.V.(2014). Obraz goroda glazami zhitelei [The image of the city through the eyes of residents]. Vіsnik PDABA – [The Bulletin of the PSACEA] No.3. 64-70. Available at: https://cyberleninka.ru/article/n/obraz-goroda-glazami-zhiteley (accessed date: 10/2/2021).
  5. Alam M., Abid F., Guangpei C., Yunrong L.Y. (2020). Social media sentiment analysis through parallel dilated convolutional neural network for smart city applications. Computer Communication.Vol.154. 129-137. DOI: 10.1016/j.comcom.2020.02.044
  6. Milington N. (2020). Urban Representation. International Encyclopedia of Human Geography. 111-118. DOI: 10.1016/B978-0-08-102295-5.10351-8
  7. Oliveria J., Pinto M., Salerio P., Teixeria J. (2016). SentiBubbles: Topic Modeling and Sentiment Visualization of Entity-centric Tweets . The Ninth International C* Conference. Available at: https://arxiv.org/pdf/1607.00167.pdf (accessed date: 10/2/2021)
  8. Pereira J. (2017). Social Media Text Processing and Semantic Analysis for Smart Cities. Universidade do Porto. 82 p. Available at: https://arxiv.org/abs/1709.03406 (accessed date: 10/2/2021)
  9. 20 cifr i faktov o VKontakte, neobhodimye marketologu v 2020 (2020). Available at: http://www.apastyle.org/apa-style-help.aspx (accessed date: 10/2/2011).
English