2024/07/17 2

〔Data Labeling〕 사투리·국내 주요도로 등 AI 학습용 데이터 170종 개방

〔Data Labeling〕 사투리·국내 주요도로 등 AI 학습용 데이터 170종 개방(korea.kr) 과학기술정보통신부와 한국지능정보사회진흥원은 인공지능(AI) 허브(aihub.or.kr)를 통해 학습용 데이터 4억 8000만 건을 개방한다고 18일 밝혔다.   과기정통부는 지난 2017년부터 기업·연구자·개인 등이 시간 및 비용 문제로 개별 구축하기 어려운 인공지능 학습용 데이터를 구축·개방해왔다. 지난해부터는 디지털 뉴딜 ‘데이터 댐’ 구축 프로젝트의 일환으로 구축 규모를 대폭 확대해 추진 중이다. 인공지능 학습용 데이터는 인공지능 개발에 사용된다. 그동안 국내 인공지능 기업들은 인공지능 개발에 필요한 데이터 확보를 위해 해외 오픈데이터를 많이 활용해 왔다. 그러나 한국어, 국내 도로환경 등 국내..

〔Data Labeling〕 데이터 라벨링의 정의와 데이터 구축단계

〔Data Labeling〕 데이터 라벨링의 정의와 데이터 구축단계(tistory.com) 빅데이터, 인공지능과 같은 개념, 단어는 2020년을 살아가는 우리에게 있어서 당연한 것으로 생각 하고 있다. 아니 오히려 모르면 이상한 취급을 당할지도 모른다. 그럼 다시, 인공지능과 빅데이터를 쉽게 이야기하는 당신에게 묻겠다. '이것들은 무엇인가?' 이렇게 이야기하면 쉽게 대답을 하기가 힘 들 것이다. 이는 우리가 쉽게 말하는 이 개념을 잘 모른다는 이야기가 아닌가 싶다. 어쩌면 이들의 기반인 데이터에 대해서도 잘 모를 수도 있다는 생각이 든다.   ◇인공지능(AI)이 있기 위해서는 '잘 만들어진' 데이터가 필요하다. 아주 쉽게 예를 들어보자. 우리가 지식을 쌓고 학습을 하기 위해서는 다양한 자료를 기반으로 한..