Аналітики з Південної Кореї прогнозують ціну біткоіни за повідомленнями на форумах

Дослідження, доступне всім бажаючим, було опубліковано 12 травня вченими з Університету Корі і Університу Кангнам, що знаходяться в Південній Кореї, розповідає про метод, що дозволяє прогнозувати коливання цін і кількість транзакцій біткоіни, заснованому на думках користувачів, азмещенних на онлайн-майданчиках.

Авторами документа під назвою "Коли біткоіни залежить від інформації на форумі: використання аналізу тексту для вивчення думки користувачів і передбачення коливання цін на криптовалюта" (When Bitcoin encounters information in an online forum: Using text mining to analyze user opinions and predict value fluctuation) стали південнокорейські вчені - Янг Бін Кім (Young Bin Kim), Юрим Лі (Jurim Lee), Нюрі Парк (Nuri Park), Джегул Чу (Jaegul Choo), Чон Хюн Кім (Jong-Hyun Kim) і Чан Хун Кім ( Chang Hun Kim).

На відміну від попередніх досліджень кріптовалютних форумів, які не приділяли увагу дійсно відповідати своїй назві коментарів, це нове дослідження використовувало інший метод, який передбачає виділення ключових слів з коментарів користувачів за допомогою яких дослідники намагаються прогнозувати ціну на біткоіни і ступінь коливання кількості транзакцій, які ґрунтуються на даних форумів в період з грудня 2013 року по вересень 2016 року Дослідники створили модель, засновану на глибокому вивченні даних, яка твердженням ляє передбачити ціну на біткоіни і кількість транзакцій в мережі.

Для розробки моделі спочатку вчені збирали дані - записи, які стосуються біткоіни, опубліковані на онлайн-майданчику (bitcointalk.org), щоденна кількість транзакцій мережі і ціни на біткоіни. Ключові слова бралися із записів на форумі bitcointalk і оцінювалися на основі рейтингу записів на форумі. У дослідженні розглядалися записи, опубліковані в підрозділі "Дискусії про біткоіни" розділу "біткоіни", так як саме в цій гілці найбільш активно публікуються коментарі. При цьому ніякі персональні дані учасників, які публікували записи, в дослідженні не фігурують.

Потім була створена терміном-документная матриця (математична матриця, що описує частоту термінів, які зустрічаються в колекції документів) на основі 17 381 статті на форумі і 627 122 коментарів, залишених на форумі. Кожна стаття містила п'ять атрибутів: 'зміст', 'тема', 'коментарі', 'дата' і 'перегляди', а кожен коментар включав такі дані: "зміст" і "дата". За допомогою даних поля 'дата' дослідники розділили термінів-документную матрицю для створення щоденного аналізу, а потім витягли різні набори тим і значущі ключові слова, використані в різні дні.

Крім даних форуму Bitcointalk. org, були використані цінові показники, розміщені на Coindesk, а також дані Google Trends і дані про використання Вікіпедії - все це допомогло зробити дослідження більш повним. Отримані результати цілком задовольнили дослідників. Найточніша модель прогнозування ціни на біткоіни досягає точності прогнозів в 80. 39%, тоді як найбільш точна модель прогнозування кількості транзакції біткоіни мала коефіцієнт точності 81, 37%.

"Проте, пропонований метод має обмеження з точки зору його більш широкого використання через те, що бралися дані за тривалий період часу.Більш того, справжні висновки вимагають подальших досліджень з аналізу коментарів користувачів щодо характеристик форумів біткоіни "

Варто відзначити, що ці ж методи і модель, які використовуються для прогнозування ціни на біткоіни і кількості транзакцій мережі, також можуть бути використані для створення аналогічного прогнозу для інших криптовалюта. Дослідження отримало підтримку Програми фундаментальних наукових досліджень Національного дослідницького фонду Кореї (NRF), що фінансується Міністерством утворений я, науки, інформаційних та комп'ютерних технологій і планування на майбутнє, а також гранту Інституту сприяння розвитку інформаційно-комунікаційних технологій (IITP), що фінансується урядом Кореї.

Хоча ми ще й дуже далекі від того, щоб прогнозувати коливання цін на криптовалюта зі стовідсотковою ймовірністю, особливо з урахуванням несподіваних подій, це дослідження - перший крок, що дозволяє використовувати дані соціальних мереж і тренди для прогнозування валютних флуктуацій. Дослідження цілком може бути використано для створення більш точної моделі прогнозування в майбутньому.