Data Science and Machine Learning
-
Session Language |English
Ми всі чули фразу "дані - це нова нафта", але так само, як і сиру нафту, дані потрібно обробляти, перш ніж їх можна буде використовувати. Що стосується неструктурованих даних, таких як зображення, відео та текст, часто цей етап підготовки включає анотацію даних людиною. Як і будь-які ручні зусилля, це трудомісткий і дорогий процес. Що ще гірше, глибокі штучні нейронні мережі, які застосовуються як для комп'ютерного зору, так і для обробки природної мови - це алгоритми, які вимагають для тренування найбільших обсягів даних. Одним із способів заощадити гроші та час на анотацію даних є використання моделі, що зазвичай є кінцевим продуктом, у процесі анотування. У цій доповіді ми розглянемо деякі підходи до анотації даних за допомогою моделей (а саме, автоматичне маркування та активне навчання), а також загальні випадки використання, для яких ці методи найкраще підходять.