필터 버블이란? (feat. 빅데이터 분석과 추천 알고리즘)

평소 유튜브 쇼츠나 인스타그램 릴스 등 숏폼 미디어를 접하다보면, 내가 관심 있는 분야와 유사한 콘텐츠만 끊임없이 피드에 노출되는 현상을 쉽게 경험할 수 있다. 이러한 초개인화 기술은 사용자에게 시각적 편리함을 주기도 하지만, 한편으로는 자신과 다른 관점의 정보를 접할 기회를 차단하여 ‘우물 안 개구리’를 만드는 ‘필터 버블(Filter Bubble)’ 현상을 유발한다는 점에서 사용자의 주의가 요구된다.

각종 숏폼 플랫폼들은 다양성보다는 플랫폼의 체류 시간 연장을 최우선 목표로 삼고 있으며, 해당 목표의 충족을 위해 빅데이터 분석, 추천 알고리즘, 필터 버블이라는 일련의 개념들을 이용하고 있다.

본 페이지에서는 해당 핵심 키워드 3종에 대한 기본 개념과 기술적 원리에 대해 설명한다.


빅데이터 분석

숏폼 플랫폼의 추천 시스템의 시작점은 빅데이터 분석에 있다. 빅데이터 분석은 사용자의 행동 데이터를 수집하고 처리하는 기술을 의미한다.

플랫폼은 사용자의 디지털 발자국(Digital Footprint) 및 쿠키(Cookie) 추적을 통해 사용자의 시청 시간, 좋아요, 댓글, 검색 기록 등 방대한 데이터를 실시간으로 수집하고 분석한다. 즉, 이 빅데이터는 추천 알고리즘을 학습시키는 핵심 재료가 된다.


추천 알고리즘

사용자의 과거 시청 기록을 바탕으로 콘텐츠를 추천하는 ‘콘텐츠 기반 필터링’과 나와 비슷한 성향을 가진 다른 사용자가 선호하는 콘텐츠를 추천하는 ‘협업 필터링’ 기술이 적용된다.


필터 버블

알고리즘이 사용자의 체류시간을 늘리기 위해 입맛에 맞는 정보만 편식하게끔 제공하는 정보 기술의 부작용을 일컫는 말이다. 알고리즘이 고도화될수록 사용자는 자신도 모르게 편향된 정보의 거품(버블) 안에 갇히게 되는 원리로, 강화학습과 같은 알고리즘 학습 메커니즘 적용과 동적 랭킹 알고리즘의 적용을 통해 필터 버블의 영향성은 증대되고 있다.

빅데이터분석, 추천 알고리즘과 필터버블


빅데이터 분석(필터 버블)의 문제점과 사회적 영향

오늘날 유튜브 쇼츠나 인스타그램 릴스와 같은 숏폼 플랫폼은 정보의 다양성보다 사용자의 ‘플랫폼 체류 시간 연장’을 최우선 목표로 두고 작동합니다. 이를 위해 플랫폼은 사용자의 디지털 발자국(Digital Footprint)과 쿠키(Cookie) 추적 기술을 활용하여 시청 시간, 좋아요, 댓글, 검색 기록 등 방대한 데이터를 실시간으로 수집하는 빅데이터 분석을 수행합니다.

이렇게 수집된 재료를 바탕으로 AI는 사용자의 과거 시청 기록을 따르는 ‘콘텐츠 기반 필터링’과 유사 성향 집단의 데이터를 활용하는 ‘협업 필터링’ 기술을 적용합니다. 특히, 사용자가 입맛에 맞는 정보에 반응할 때 보상을 얻도록 학습된 ‘강화학습’ 메커니즘과 실시간으로 상단 노출 순위를 바꾸는 ‘동적 랭킹 알고리즘’이 결합하면서 알고리즘은 극도로 고도화됩니다.

이로 인해 가치관이 형성되는 시기인 청소년들이 알고리즘이 제공하는 정보만 수동적으로 수용할 경우, 자신도 모르게 편향된 정보의 거품 안에 갇히는 ‘필터 버블’과 확증 편향에 깊게 빠지기 쉽습니다. 이러한 기술적 부작용은 개인의 지적 고립을 넘어, 나와 다른 생각을 용인하지 않는 사회적 양극화와 디지털 공간 내 혐오 문화 확산이라는 심각한 부작용으로 이어지고 있습니다.



필터버블 어떻게 해결할까?

이러한 필터 버블 문제를 해결하기 위해서는 먼저 사용자 측면에서 알고리즘의 데이터 수집과 필터링 원리를 주체적으로 이해하고, 의식적으로 다양한 분야와 관점의 영상을 찾아보며 확증 편향을 깨뜨리려는 ‘디지털 리터러시’ 노력이 필수적입니다.

이와 함께 플랫폼 기업 차원의 기술적 결단도 요구됩니다. 기업은 강화학습과 동적 랭킹 알고리즘이 실시간으로 축적해 온 사용자의 추천 데이터와 성향 프로필을 사용자가 원할 때 언제든 리셋할 수 있도록 ‘추천 알고리즘 초기화 기능’을 앱 내에 전면 배치해야 합니다.

빅데이터 수집에 대한 거부권을 보장하고 알고리즘을 사용자가 스스로 제어할 수 있는 직관적인 기회를 제공할 때, 청소년들은 비로소 수동적인 정보 수용자에서 벗어나 필터 버블을 스스로 깨고 나오는 능동적인 디지털 시민으로 성장할 수 있을 것입니다.


마치며

빅데이터 분석은 사용자의 시청 기록, 검색 기록, 좋아요 등 다양한 행동 데이터를 수집·분석해 추천 시스템을 학습시키는 핵심 기술이다. 추천 알고리즘은 사용자가 좋아했던 콘텐츠와 비슷한 콘텐츠를 추천하거나, 유사한 성향의 다른 사용자가 선호하는 콘텐츠를 추천하는 방식으로 작동한다. 하지만 이러한 기술은 사용자가 관심 있는 정보만 반복적으로 접하게 만들어 편향된 정보 환경인 필터 버블을 형성할 수 있다는 부작용도 가지고 있다.