빅 데이터는 미국 전역의 일상 생활을 어떻게 변화시키고 있습니까?

빅 데이터는 미국 전역의 일상 생활을 어떻게 변화시키고 있습니까?
빅 데이터는 미국 전역의 일상 생활을 어떻게 변화시키고 있습니까?

비디오: (유물다큐) 16살 학생이 물리학 논문을?! 독창성과 창의성을 중시하는 미국 과학고등학교의 영재들 (KBS 010425 방송) 2024, 할 수있다

비디오: (유물다큐) 16살 학생이 물리학 논문을?! 독창성과 창의성을 중시하는 미국 과학고등학교의 영재들 (KBS 010425 방송) 2024, 할 수있다
Anonim

'빅 데이터'라는 개념은 어디에나 있지만, 그것이 무엇이며 어떻게 우리의 생활 방식을 바꾸고 있습니까? 우리는 데이터 과학자, 하버드 박사 및 National Book Award 후보 인 Cathy O'Neil과 함께 앉아 발견했습니다.

CT: 기본부터 시작하겠습니다. 정확히 '빅 데이터'란 무엇입니까?

CO: 빅 데이터는 상황을 예측하는 새로운 접근법입니다. 보다 구체적으로, '빅 데이터'는 브라우저를 통한 검색 방법 또는 Facebook에서 수행하는 작업과 같이 실수로 수집 한 데이터를 사용하여 구매할 대상 또는 정치적 소속과 같은 자신에 대한 정보를 유추하는 것입니다. 사람들을 알아내는 간접적 인 방법입니다. 예를 들어, 우리를 감시하는 카메라는 '무엇을하고 있습니까?'라고 묻지 않습니다. – 우리가하는 일을 알게됩니다.

CT: 그리고 알고리즘은 무엇입니까?

CO: 알고리즘은 예측을 만들기 위해 사용자에 대해 수집 한 데이터를 [해석]하는 계산입니다. '이 사람이 무언가를 사려고합니까?'와 같이 예측으로 구성된 질문에 대답하려고하는 수학적 방정식처럼 생각하십시오. 또는 '이 사람이 누군가에게 투표하려고합니까?'

CT: 지금 왜 그것에 대해 그렇게 많이 듣고 있습니까?

CO: 빅 데이터 이전에 통계 학자들은 사람들을 조사하여 미래를 알아내는 등 비싼 일을했을 것입니다. 예를 들어, 사람들에게 '당신은 누구에게 투표 할 것입니까?'와 같은 직접적인 질문을합니다. 이제 우리는 점점 더 '데이터 배출'에 의존하고 있는데, 이것이 당신에 대해 지속적으로 수집되는 데이터라고 부르는 것입니다.

'빅 데이터'이전에는 회사에서해야 할 추측이 많았습니다. 이제 우리는 거친 추측보다 낫습니다. 놀랍게도 대부분의 빅 데이터 알고리즘은 매우 부정확하며, 그것이 옳다고 생각할 이유가 없습니다. 그러나 그것들은 거친 추측보다 낫습니다. 이것이 바로 빅 데이터가 그랬던 것처럼 발전한 이유입니다.

CT: 정확하지 않다면 무엇을 반영하고 있습니까?

CO: 우리가 공급 한 결함이있는 데이터 세트. 알고리즘은 우리가 말하는 것 외에는 아무것도 모릅니다. 따라서 고르지 않은 데이터가 있고이를 알고리즘 또는 바이어스 된 데이터에 공급할 때 그것이 현실이라고 생각할 것입니다.

Image

아일 사 존슨 / © Culture Trip

CT: 실제 사례는 무엇입니까?

CO: 예를 들어 미국에서는 흑인이 백인보다 5 배나 흡연자로 체포 될 가능성이 높습니다. 흑인이 냄비를 더 자주 흡연하기 때문이 아닙니다. 두 그룹이 같은 비율로 냄비를 흡연합니다. 흑인들은 체포 될 가능성이 훨씬 높습니다. 이 알고리즘을 우리가하는 알고리즘에 넘기면 앞으로 흑인이 흡연 냄비로 체포 될 가능성이 훨씬 높아질 것입니다. 그리고 그것은 흑인들에게 범죄에 대한 더 높은 위험 점수를 줄 것이며, 이는 형사 선고에 영향을 미칩니다.

또 다른 예는 사고 실험입니다. Fox News는 최근에 성주의 내부 문화와 관련된 분화가 있었기 때문에 Fox News를 사용할 것입니다. 실험은 'Fox News가 미래에 사람들을 고용하기 위해 기계 학습 알고리즘을 구축하기 위해 자신의 데이터를 사용하려고하면 어떻게 될까요?'

예를 들어 폭스 뉴스에서 성공한 사람들을 찾고 있다고 가정 해 봅시다. 성공을 정의하는 방법에 따라 다르지만 일반적으로 모금, 승진 또는 오랫동안 머무는 사람들을 보게 될 것입니다. 이러한 조치들 중 어느 것에 의해서도, 데이터는 여성들이 Fox News에서 성공하지 못한다는 것을 반영 할 것입니다. 채용 알고리즘으로 사용되는 경우 해당 문제가 전파됩니다. 그것은 지원자 풀을보고 '여기서는 성공하지 못하기 때문에 어떤 여성도 고용하고 싶지 않습니다. 그들은 좋은 고용이 아닙니다. ' 폭스 뉴스 일 필요는 없습니다. 모든 기업 문화에는 편견이 있습니다. 알고리즘 데이터를 공급하면 알고리즘 바이어스가이를 전파합니다. 사회에 이미 존재하는 편견을 지속적으로 강화하고 있습니다.

CT: 편견이 의도적인가?

CO: 저는 데이터 과학자들이 성 차별 주의자 또는 인종 차별주의 알고리즘을 만들려고하지 않는다고 생각합니다. 그러나 머신 러닝 알고리즘은 상대적으로 미묘한 패턴을 포착 한 다음 전파하는 데 탁월합니다. 데이터 과학자들이 의도적으로하는 일이 아니지만 그럼에도 불구하고 편견입니다.

CT: 일상 생활에서 부정확 한 알고리즘은 어떤 역할을합니까?

CO: 대학 입학부터 취업에 이르기까지 사람들의 삶에 대한 모든 종류의 결정에 사용되고 있습니다.

경찰이 이웃을 어떻게 경찰에 처하게 할 것인지를 결정하는 알고리즘과 판사가 피고를 선고 할 방법을 결정하는 알고리즘이 있습니다. 보험료 또는 지불 할 APR [이자율] 종류를 결정하는 알고리즘이 있습니다. 임금 인상을 결정하는 데 사용되는 업무 수행 방식을 결정하는 알고리즘이 있습니다. 태어날 때부터 죽음까지 모든 단계의 알고리즘이 있습니다.

CT: 그럼 어디로 우리를 떠나나요?

CO: 우리는 빅 데이터 시대에 뛰어 들었고, 우리가 가진 모든 문제마다 알고리즘이 인간보다 공정해야한다는 가정하에 알고리즘을 던졌습니다. 그러나 실제로는 인간만큼 불공평합니다. 우리는 더 잘해야합니다.

오닐 박사와의 인터뷰의 두 번째 부분을 읽으려면 여기를 클릭하십시오. 그녀의 저서 인 수학 파괴의 무기: 빅 데이터가 어떻게 불평등을 증가시키고 민주주의를 위협 하는가?

24 시간 인기