ЗАСТОСУВАННЯ МЕТОДІВ МАШИННОГО НАВЧАННЯ ДЛЯ АНАЛІЗУ ПОВІДОМЛЕНЬ В TWITTER

Автор(и)

  • Herasymchuk P.V.
  • Likhouzova T.A.
  • Oliinyk Y.O.

DOI:

https://doi.org/10.34185/1562-9945-6-155-2024-05

Ключові слова:

класифікація текстів, обробка природної мови, соціальні мережі, кібербулінг, бінарна класифікація, оцінка моделі, word2vec, Bag-of-Words, TF-IDF.

Анотація

В сучасному світі соціальні мережі стали невід'ємною частиною життя багатьох людей. Вони є зручним та доступним засобом повсякденного спілкування. Однак з розвитком соціальних мереж з'явилися й проблеми, однією з яких є кібербулінг. В роботі виконано попередню обробку текстових повідомлень, розглянуто різні методи бінарної класифікації текстів та застосовано їх для визначення кібербулінгу в по-відомленнях Twitter. Проведено дослідження ефективності кожного з методів та виконано їх порівняльний аналіз. Програмне забезпечення реалізоване мовою Python із застосуванням бібліотек spaCy, gensim, scikit-learn, pandas, numpy, matplotlib.

Посилання

Pisarenko O. A. Intelektualna sistema filtraciyi komentariv z vikoristannyam ma-shinnogo navchannya. – 2019.

Ivanov O. A. Rozrobka servisu dlya borotbi z kiberbulingom //Avtomatizaciya ta komp’yuterno-integrovani tehnologiyi u virobnictvi ta osviti: stan, dosyagnennya, perspek-tivi rozvitku. – S. 298.

https://www.kaggle.com/datasets/andrewmvd/cyberbullying-classification/

Dokumentaciya movi programuvannya Python. [Elektronnij resurs] – Rezhim dostupu do resursu: https://docs.python.org/3/

Dokumentaciya biblioteki spaCy. [Elektronnij resurs] – Rezhim dostupu do resursu: https://spacy.io/usage

Dokumentaciya biblioteki Gensim. [Elektronnij resurs] – Rezhim dostupu do resursu: https://radimrehurek.com/gensim/

Dokumentaciya biblioteki scikit-learn. [Elektronnij resurs] – Rezhim dostupu do resur-su: https://scikit-learn.org/stable/

Завантаження

Опубліковано

2025-02-02