728x90
반응형
빅데이터의 활용 현황, 문제점과 대책 - 한국경제연구원
아마존 이용고객이라면 해당 인터넷 사이트를 로그인 할 때, 추천도서가 뜬다는 것을 알고 있을 것이다. 이때 추천도서는 일괄적인 것이 아니라 로그인 한 회원마다 달리 나타난다. 아마존은 과
www.keri.org
빅데이터란 기존 데이터베이스의 관리 능력을 초과하는 정형/비정형 데이터로부터 가치를 추출하고 결과를 분석하는 기술이다.
데이터를 잘 분석하면 유의미한 결과를 얻을 수 있다.
그러나, 사실 이 데이터들은 개인정보의 집합으로 문제가 될 수 있다.
얼마 전 금융회사의 고객정보가 대규모로 유출되어 사회적인 문제가 된 것처럼 빅데이터는 대량의 개인정보가 수집 및 관리되므로 사업자의 고의 또는 과실에 의해 개인정보가 침해 혹은 누설될 수 있다.
예를 들어, '이루다' 챗봇의 경우 커플들의 대화를 수집했는데
이 때 수집한 대화로 학습을 시켜 챗봇을 만들었더니
대화를 하다보면 누군가의 개인 정보(이름, 사는 곳) 등이 유출되는 경우가 있었다.
(이 케이스를 빅데이터 수집의 문제라고 봐야 하는지는 조금 의문이지만 생각나서 적어봤다🤔)
728x90
반응형