실시간 뉴스



초거대AI 승패 가르는 '데이터 전쟁' 서막을 열다


머스크, MS에 트위터 데이터 소송전 예고…트위터 API 월 구독료 부과 예정
미국 온라인 커뮤니티 레딧, API 유료화 공식화
네이버 계열사, 뉴스 데이터 이용 약관 철회…블로그·카페 데이터 활용 중

[아이뉴스24 박진영 기자] 글로벌 빅테크 기업들의 초거대 인공지능(AI) 격전이 '데이터 전쟁'으로 옮겨붙었다. 초거대 AI를 학습시키기 위해서는 방대한 데이터가 필요해 이를 확보하려는 경쟁이 치열하게 펼쳐지는 것이다. SNS 기업들은 무료로 공개하던 데이터를 유료로 전환하거나 AI 학습에 활용할 수 없도록 조치를 취하느라 분주하다.

글로벌 빅테크 기업들의 초거대 인공지능(AI) 경쟁이 가열되면서 AI학습 데이터 확보 전쟁이 본격화될 조짐이다. [사진=픽사베이]
글로벌 빅테크 기업들의 초거대 인공지능(AI) 경쟁이 가열되면서 AI학습 데이터 확보 전쟁이 본격화될 조짐이다. [사진=픽사베이]

22일 업계에 따르면, 앨런 머스크는 최근 자신의 트위터를 통해 "마이크로소프트(MS)가 트위터의 데이터를 불법으로 사용해 인공지능을 훈련시키고 있다"면서 "소송해야 할 때"라고 말했다. MS가 광고 플랫폼에서 트위터를 제외하겠다는 소식이 전해진 직후 이같이 맞대응한 것이다.

이에 대해 미국 경제매체 CNBC는 "머스크의 고소 위협은 데이터 소유권이 생성형 AI 개발 경쟁을 둘러싼 전쟁터가 되고 있음을 보여주는 최신 징후"라고 분석했다.

오픈AI의 챗GPT와 같은 초거대AI 모델을 개발하려면 대량의 학습 데이터가 필요한데, 대부분 온라인 웹사이트에서 수집되는 데이터를 활용하는 경우가 많다. 트위터 등 SNS 데이터가 대화 형태의 내용이 많아 가치가 높은 것은 것으로 알려졌다.

트위터는 오늘 29일부터 기업을 대상으로 응용프로그램인터페이스(API) 유료화 구독 정책을 시행할 방침이다. 그동안 무료로 제공해온 API 접근 권한에 대한 이용료로 월 4만2천달러(한화 약 5천600만원)를 부과하는 것이다.

트위터에 이어 미국 온라인 커뮤니티 레딧도 데이터 유료화를 선언했다. 2005년 개설된 레딧은 일평균 방문자가 5천700만명에 이른다. 스티브 허프먼 레딧 최고경영자(CEO)는 뉴욕타임스를 통해 "레딧의 데이터들은 가치가 있다. 가치 있는 데이터를 기업들에게 공짜로 제공할 필요가 없다"고 밝혔다. 빅테크 기업들이 레딧의 API를 무료로 받아 초거대AI를 학습시키는 반면 레딧은 어떤 이득도 없는 문제를 해결하려는 것이다.

국내에서는 네이버가 대화형 검색 서비스 '서치GPT' 등의 AI 연구에 뉴스 데이터를 활용하고 있다. 네이버와 제휴 언론사가 맺은 뉴스 약관에는 네이버가 서비스 연구에 정보를 이용할 수 있도록 규정하고 있다. 최근 네이버 계열사도 뉴스 정보를 이용하도록 약관을 개정하려다 비판이 일자 철회한 바 있다.

네이버의 AI 학습데이터 절반 이상은 네이버 블로그나 카페에서 가져오고 있다. 이를 위해 네이버는 2018년 사용자 약관에 '네이버 및 네이버 계열사가 블로그나 카페 사용자가 제공하는 콘텐츠를 AI 기술 연구 목적으로 활용할 수 있도록' 조항을 추가했다.

/박진영 기자(sunlight@inews24.com)

2024 iFORUM






alert

댓글 쓰기 제목 초거대AI 승패 가르는 '데이터 전쟁' 서막을 열다

댓글-

첫 번째 댓글을 작성해 보세요.

로딩중
포토뉴스