스토리

공익데이터, 데이터 액티비즘의 다양한 목소리를 기록해요.

필터
오염수 방류 후 윤석열 대통령은 수산시장에서 이런 말을 했습니다

일본 정부의 후쿠시마 원자력 발전소 오염수가 방류 뒤 한국의 윤석열 대통령은 8월 31일 노량진 수산시장을 찾았습니다. 윤 대통령이 시장을 찾아 한 발언들은 곧바로 한겨레 ‘우럭탕 한 그릇 비운 윤 대통령 “상인들 힘 나면 좋겠다”’ 등 언론에 보도됐는데요. “제가 와서 조금이라도 시장 상인들이 힘이 나면 좋겠다” 등의 내용이었습니다. 대통령의 발언은 정부의 입장과도 연결되기에 꽤나 중요한 데이터입니다. 그래서 윤석열 대통령이 언론에 보도된 발언을 했는지, 다른 말은 더 하지 않았는지 궁금해졌습니다. 그래서 원본 데이터를 찾아나섰습니다. 윤석열 대통령의 발언 데이터를 찾아봅시다 데이터를 찾는 과정은 꽤나 막막합니다. 하지만 막막하더라도 무엇이든 해야 시작이 되겠죠. 저는 한국 대통령의 발언이니 관련 정보가 모두 모여있을 것만 같은 ‘대통령실’을 구글에 검색해서 들어갔습니다. 대통령실 홈페이지 메뉴 출처: 대통령실 대통령실 메뉴를 보니 왠지 발언을 금방 찾을 것 같은 느낌이 들었습니다. 첫 번째로 확인한 메뉴 목록에서 ‘대통령의 말과 글’을 찾았기 때문이죠. 왠지 일이 술술 풀릴 것 같습니다. 금방 데이터를 찾고 스스로 뿌듯해할 것 같은 느낌이 마구 듭니다. 하지만 마음대로 되지 않는 게 우리 삶이죠? 예상과 달리 ‘대통령의 말과 글’ 게시판엔 8월 31일 윤석열 대통령이 노량진 수산시장에서 했던 발언이 없었습니다. 아직 포기하긴 이릅니다. “중요한 건 꺾이지 않는 마음”입니다.  마침 대통령실 메뉴에 돋보기 모양의 검색 버튼이 보이네요. 그래서 검색을 통해서 발언을 찾아봅니다. 키워드는 아무래도 정보를 곧바로 찾으려면 반드시 들어가면서도, 흔한 정보와 겹치지 않는 단어가 좋겠죠. 핵심 요소 중 하나인 ‘수산시장’으로 키워드를 정했습니다.  대통령실 수산시장 검색 결과 출처: 대통령실 역시 선택이 옳았습니다! 검색해보니 윤 대통령 발언이 담긴 브리핑이 곧바로 보이네요. 이제 내용을 확인할 차례입니다. 대통령실 브리핑 내용 출...

발행일 2023.09.13.

일본은 원전 오염수 피해자를 어떻게 보호하고 있을까요?

얼마 전, 오염수 방류가 진행되었습니다. 방류 전과 후에 계속해서 뉴스가 나오면서 사람들이 굉장히 걱정을 많이 했는데요. 특히 직접적으로 영향이 있는 분들은 '수산 사업자'분들이라는 생각이 들었습니다. 아무래도 사람들은 수산 시장에 가는 것을 꺼려하게 되고, 원산지를 한번 더 살펴볼테니까요. 실제로도 뉴스를 보니 중국에서는 일본의 수산물을 수입 금지하겠다고 WTO에 통보를 했다는 이야기가 많았습니다.  곳곳에 보이는 일본의 오염수 지원 정책 분명 국내에도 영향이 있을텐데, 생각보다 국내 수산 사업자분들에 대한 이야기는 없더라구요. 오히려 찾으면 찾을수록 일본의 지원 정책만 국내에서 연일 보도되고 있었습니다. 교도통신 “일본, 자국 수산업자에 천 8백억 원 지원 조율 중” (2023.09.02 KBS 뉴스) 중국, 일본 수산물 수입금지 WTO 통보···일본은 수산업자에 1800억원 지원 (2023.09.02 뉴스프리존) "日정부, 수산업자 보호 위해 기존 기금에 수백억엔 추가 검토" (2023.08.30 연합뉴스) 오염수 관련 뉴스 과연 일본은 얼마나 수산업계를 지원하고 있을까? 보통 외국의 사례가 겉으로 보았을 때 그럴듯해 보이는 경우가 있을테니, 이번에도 그런 경우일까? 하는 생각이 들어서 정말일까 하는 생각이 들었는데요, 특히 "수산시장 찾은 일본 기시다 총리…수산업계 지원 대책도 내놔"(2023.08.31 연합뉴스) 에서 다음과 같은 문장에 집중을 했습니다. 일본 정부는 이날 중국의 일본산 수산물 전면 수입 금지에 따른 수산 사업자 보호를 위해 기존에 적립해 놓은 기금에 수백억엔을 추가하는 등의 내용이 담긴 지원책을 발표 어떻게 찾아볼 수 있을까 고민을 하다 수산업 지원방안을 일본에서 어떻게 이야기하고 있는지 검색을 해보려 했습니다. 일본어를 잘 하지는 못하니 네이버 파파고의 도움을 받았죠. "수산업 지원방안"을 영문으로 번역한 뒤에 일본어로 다시 한번 번역을 했습니다.  '水産業に対する支援措置' 라는 (저는 잘 ...

발행일 2023.09.07.

[주거권X공익중개사] 등본에서 주거불안 이슈를 발견하다

등기부등본에서 이슈를 발견하기 위한 과정 공익중개사팀이 등기부등본이라는 서류에서 주거불안 위험요소와 관련된 이슈들을 발견하기 위해 작업했던 과정들과 개요에 대해 설명드리겠습니다.설명은 위에 나열한 6가지 파트로 진행합니다. 등기부등본에서 데이터 추출하기 전처리 진행 표제부 탐색 갑구 탐색 을구 탐색 소유자 탐색 1. 등기부등본에서 데이터 추출하기 저희는 민유에서 제공해준 등기부등본 스캔본을 데이터화하기 위해 작업을 진행했고 1,124개의 건물 등기부등본을 88개의 컬럼으로 구성되는 데이터셋으로 정리했습니다. 최종 아웃풋으로 데이터화한 등기부등본과 서울시 건축물대장을 병합하여 최종 데이터셋을 구축했습니다. 등기부등본을 데이터로 변환하는 작업은 정부문서, pdf 스캔본인 관계로 수기로 작업이 진행되어야 했고 모든 팀원들이 달라붙었습니다. 데이터 구축 작업을 통해 서류상의 건물을 분석 및 시각화가 가능해졌고, 저희가 데이터화한 건물들은 신림동에서도 아래 이미지에 보이는 위치의 건물들이었습니다. 2. 전처리 진행 등기부등본의 데이터화는 수기 입력으로 진행됐다고 언급했었는데요. 수기입력이다보니 데이터셋으로 구축하는 과정에서 전처리가 필요했습니다. 전처리 작업은 크게 3가지 영역으로 구분이 가능합니다.  서류의 내용을 수기로 옮기면서 발생한 다양한 휴먼에러 등기부등본은 공문서이지만, 놀랍게도 에러값과 서식이 불일치하는 부분들 존재 데이터 클랜징 후 파생변수 생성 3. 표제부 등기부등본은 크게 표제부, 갑구, 을구 3가지로 구분됩니다. 표제부는 부동산에 대한 정보를 나타냅니다. 표제부에 관련된 컬럼은 총 25개이며 그 중 주거권과 관련이 있을 것으로 예상한 몇가지 컬럼들의 개요는 다음과 같습니다. 저희가 작업한 구역의 건물들 중 약 25%는 근린생활시설이었고, 최대 지상 6층, 지하 2층의 건축물들이며, 38%의 건물들이 옥탑을 보유하고 있었습니다. 4. 갑구 갑구는 해당 부동산의 ...

발행일 2023.08.24.

[주거권X공익중개사] 등기부등본이 지저분한 집주인 당신! 도대체 어떤 문제가?

💡 내가 정한 주제는?  등기부등본이 지저분한 집주인 당신! 도대체 어떤 문제가? 🤔 문제의식  대학동 등기부등본 데이터 수집 작업 중, 특정 인물(유춘O, 조은O)의 명의로 되어있었거나 현재 되어있는 다수의 건물(집)에 임차인이 조심해야 할 위험용어(압류, 경매, 신탁 등)가 많이 보이고, 제3금융권과 개인 채권을 포함한 저당권 설정이 과하게 되어있음을 확인하였음. 또한, 전세 사기 위험이 발생한 경우 임차인이 가장 많이 실행하는 임차권 설정도 등본에 다수 되어있어 이들의 사례를 보다 자세히 파악하여, 임차인들이 어떤 문제를 겪어왔는지 데이터로 발굴해보고자 함. 이를 통해 동일한 임대인(가족)이 소유한 여러 건물(집)이 얽혀있는 문제를 등기부등본 상에서 어떻게 확인할 수 있는지, 그리고 이를 토대로 어려움을 겪은 청년 임차인이 있는지, 구제책과 예방책은 무엇인지 종합적으로 살펴보고자 함. 📊 데이터셋을 토대로 이 주제에 대해 진행한 작업 유춘O, 조은O (등본상 주소가 같은 동거인_부부 추정) 총 58건 발견 유춘O, 조은O 공동명의 : 33개 조은O 단독 명의 : 10개 유춘O 단독 명의 : 13개 조사범위 외 대학동 등기부등본에서 2건 추가 발견 (아래 데이터에서는 제외) 위험용어 발견 신탁 : 75건 압류 : 3건 가압류 : 85건 경매개시 : 67건 저당권(채권) TOTAL : 8,614,340,000원 (팔십육억일천사백삼십사만원) 채무자 명의 기준 유춘O 단독 채권 총액 : 6,874,940,000원 유춘O, 조은O 공동 명의 채권 총액 : 1,386,000,000원 유다O(유춘식 자녀 추정) 단독 채권 : 236,400,000원 조은O 단독 채권 총액 : 117,000,000원 채권자 유형 기준 1~2금융권(하나은행, 국민은행, 새마을금고, 경기남부수산업협동조합) : 4,772,340,000원 3금융권(두리에이엠씨대부주식회사, 주식회사씨앤아이파이낸셜대부) ...

발행일 2023.08.22.

[오염수X데이터캠페인] 오염수 아카이브 시작! in 코드포코리아 밋앤핵

8월 19일 코드포코리아 밋앤핵  - 물음표 프로젝트, 테스트를 시작합니다! 디지털 기술로 사회 문제를 해결하는 시민들의 시빅해킹 커뮤니티 '코드포코리아'에서 진행하는 정기 밋앤핵에서 '오염수 아카이브'를 소개하고, 함께 검증 데이터를 수집하는 작업을 시작했습니다💪(발표 자료 자세히 보기) 오늘 약 40개의 검증 데이터를 수집하고, 물음표 프로그램에서 오류를 발견해 이를 해결하는 방법을 함께 고민했습니다. 앞으로는 검증 데이터를 더 모아보면서 실제 팩트체크 검증을 해보려고 합니다! 기여해주신 아침, 바다, 원, 트리님께 감사의 인사를 남기고, 좋은 기회를 마련해주신 코드포코리아도 감사합니다! (코드포코리아 밋앤핵에서 프로젝트를 발표하고 있어요)

발행일 2023.08.19.

[그린워싱X그린이지] 그린워싱에 대응할 그린가이드 공개

“친환경이라고 하니 샀던 제품, 정말 친환경이 맞을까?” 결국 그린워싱 데이터를 모았던 가장 큰 이유는 소비자를 어렵게 하는 이 고민을 조금이나마 덜기 위함이었습니다. 그래서 누구나 조금 더 쉽게 그린워싱 여부를 판별할 수 있는, 참고할 만한 가이드를 만들었습니다.   ‘생분해’, ‘자연분해’, ‘무독성’, ‘천연유래성분’, 알 수 없는 인증마크까지…. 친환경 제품을 고를 때 소비자 개인이 판단하기 어려운 각종 용어와 문구들을 마주합니다. 그린가이드는 제품 선택 시 고민되는 질문들을 정리해 그린워싱 여부를 판단할 수 있는 팁을 제공합니다.

발행일 2023.06.03.

[그린워싱X그린이지] 친환경 키워드? 소비자를 속이는 모호한 표현들

🧐 친환경 마케팅 과정에서의 모호한 표현들 환경에 대한 모호한 표현은 왜 문제가 될까요? 소비자 오인성을 높이기 때문입니다. 환경이 걱정되기는 하지만 조금 더 빠르고 쉽게 제품을 구입하고는 싶은 소비자들에게, 제품의 성분과 인증마크를 일일이 들여다본다는 건 많은 에너지를 요구합니다. 친환경 실천의 스펙트럼은 너무나 넓고, 결국 소비자들은 각자의 환경과 의지에 따라 할 수 있는 적정선을 찾아 선택해야만 합니다. 그런 소비자들에게 애매모호한 친환경을 문구와 이미지는 혼란을 주고 있지요. 매 순간 시간과 품을 들여 행동하는 사람들에게 “이 정도면 그래도 친환경적이지 않을까?”라는 타협을 유도하기도 하고요. 📈 모호한 표현의 유형과 범주 설정 그린이지 실험실은 친환경이 아니거나 친환경성을 검증할 근거가 없음에도 소비자로 하여금 친환경 상품이라고 오인할 여지가 있는 모호한 친환경 표현들이 어떤 방식으로 이루어지는지, 그 경향을 살펴보고자 했습니다. *wordcloud_그린이지 실험실에서 수집한 136개 생활용품 제품 표본 내 친환경 키워드 빈도   조사한 생활용품의 주요 마케팅 키워드나 문구, 이미지 등을 그대로 가져와 정제해보았는데요. 오프라인 매장 내 제품 포장지의 친환경 마케팅, 온라인 제품 소개페이지 내의 친환경 마케팅 상에서 발생하는 ‘모호한 표현'의 범주를 다음과 같이 정의했습니다. 친환경성을 표현하는 키워드가 한 번 이상 포함되어 있으나 구체적인 근거가 명시되지 않은 경우 ‘친환경성을 표현하는 키워드'의 예 : ‘친환경', ‘플라스틱제로', ‘천연', ‘식물성', ‘자연유래성분', ‘자연을 담은', ‘무독성', ‘무해' 등 ‘구체적인 근거’의 예 : 성분 및 원료 출처, 공정과정, 인증마크 등 기타 : 자연물 이미지가 포함되어 환경친화적인 느낌을 연상시키지만 구체적인 근거가 명시되지 않은 경우 포함 📕 친환경 제품 마케팅 안에서 모호한 표현은 실제 어느 정도 빈도로 등장할까? 136개 생활용품 ...

발행일 2023.06.01.

[그린워싱X그린이지] 비건 제품이면 친환경…일까요?

다양한 비건 제품이 나오는 시대가 되었어요. 식품류에서 더 나아가 지금은 화장품군에서 더 흔히 볼 수 있는 단어가 되었죠. 동물권뿐만 아니라 기후위기의 맥락에서도 비건은 중요한 이슈에요. 유엔식량농업기구(FAO)에 따르면 전 세계 가축들이 배출하는 온실가스 배출량이 전체 인공 온실가스 배출량의 약 14.5%를 차지해 자동차에서 발생하는 온실가스 배출량보다 많은 수치거든요. 더불어 크게 늘어난 육식 소비량은 공장식 축산업을 부추겨 온실가스를 발생시킬 뿐 아니라 동물권을 위협하는 요소이기도 해요. 그런데 비건 제품이면... 친환경이라고 할 수 있을까요? 그린이지가 살펴본 생활용품에서는 많은 비건 제품들이 동물실험을 하지 않거나 식물성 원료를 사용한 점들을 강조하고 있었어요. 그리고 FSC인증을 받은 종이 포장재를 사용한 박스도 많이 볼 수 있었는데요. 그러나 겉의 종이 포장을 벗기면 플라스틱 용기를 사용하거나 재활용이 어려운 포장재를 사용한 제품들이 많았어요. 사은품이나 샘플이 포함된 제품의 경우,사은품이나 샘플이 일회용이고 재활용이 어려운 비닐 소재에 담겨있어 ‘친환경’과는 거리가 멀어 보였죠. 최근에는 화장품의 경우 리필 스테이션을 운영하거나 리필해주는 시스템을 운영하는 브랜드도 있는데요. 사실상 지금 바로 생각나는 몇몇을 제외하고는 리필 스테이션을 운영하는 데 필요한 인증절차가 까다로워서 많은 지점으로 확대하기가 어려운 현실이에요. 이러한 점들 때문에 일반 매장에서는 리필 제도를 운영하기 어렵고, 리필 제도를 운영하는 기업은 많이 없어서 결국 플라스틱에 담긴 새 제품을 사는 것으로 이어지고 있어요. 새로운 플라스틱 생산을 멈추어야 한다는 관점에서 본다면 비건 인증을 받았다고 친환경 제품이라고 홍보할 수 있는 걸까요? 비건 제품이 친환경성까지 제대로 갖추기 위해서는 식물성 원료를 사용함과 동시에 제품의 전 생애주기에서 환경을 고려할 수 있어야 해요. 제품을 기르는 과정부터 연구를 통해 가공되어 운송 및 포장, 판매 그리고 그 이후 처리되는 과정까지 ...

발행일 2023.05.31.

[그린워싱X그린이지] 친환경 인증마크, 얼마나 받았을까?

문제의식 내가 사용하는 제품에서 친환경을 증명하기 위해 사용된 인증마크를 유심히 본 적 있나요? 친환경에 대한 소비자들의 관심이 꾸준히 증가하면서 일반 소비자들도 제품을 구입할 때 '친환경 마크' 유무를 눈여겨 보는 경우가 증가하고 있습니다. 친환경 바람을 타고 일상의 매대에선 식품, 화장품, 의류, 생활용품 등 영역을 막론하고 친환경 마크를 쉽게 찾아볼 수 있습니다. 시장의 제품은 소비자의 눈길을 사로잡기 위해 다양한 이미지와 단어를 사용합니다. 무심코 지나쳤던 인증마크가 무엇을 의미하는지 검색하는 것만으로도 환경에 어떤 영향을 미치는지 알 수 있지만 매일 소비하며 살아가는 현대인에겐 꽤 수고가 필요한 일입니다. 일상에서 우리가 가장 흔하게 보는 친환경 마크는 우리나라 환경부가 부여하는 녹색마크가 있습니다. '환경 표지 제도', '환경 성적 표지 제도', '탄소발자국 인증 마크', '에너지 절약 마크 및 GR 마크' 로 나누어 부여하고 있으며 각 마크마다 엄격한 심사기준을 통과해야 합니다. 하지만 화장품과 같은 특정 제품군은 국내 친환경 마크보다 생소한 해외 인증마크를 부착해 소비자들에게 선보이는 경우가 훨씬 많습니다. 이러한 추세는 해외 선진국에서 인증을 받았다고 하면 다른 제품보다 더 높게 평가하는 소비자의 심리가 반영된 결과라고 추측해 볼 수 있습니다.  우리나라와 달리 외국에서는 국가 뿐만 아니라 시민단체, 연구소, 사단법인, 협회 등 독립적 기관에서 친환경과 비건 관련 인증을 다양하게 진행하고 있습니다. 특히 요즘은 화장품에 비건 관련 인증 마크를 많이 표시하는데 문제는, 인증마크가 무조건적인 친환경을 의미하지는 않는다는 점입니다. 또 '우리나라와 환경이 다른 해외에서 받은 인증마크와 국내를 비교하는 것이 적절한가'라는 의문을 제기할 수 있습니다. 지리적, 환경적 조건이 다른 것은 차치하고, 인증 전과정을 확인하기 어렵기 때문에 실제 소비자들에게 친환경 정보가 적절히 제공되는 지는 확인할 필요가 있습니다. 특히 제품의 전성분이 아니라 일부...

발행일 2023.05.31.

[크롤앤스티치] 프로젝트 결과 - 끝날 때까지 끝난 게 아니다

셰도우핀즈는 시민들과 함께 스토킹 처벌법 입법을 독려하는 웹사이트와 스토킹 기사들을 크롤링하고 분류한 데이터셋을 공개하며, 21년간 발의와 폐기를 반복한 스토킹 처벌법을 건물의 건축과 무너짐 등으로 표현한 캠페인 영상과 함께 가을 스프린트를 마무리하고 있습니다. 프로젝트의 목적은 앞의 소개 글에서 말씀드린 것처럼 지금보다 강화된 스토킹 처벌법의 제정입니다. 이를 위해 캠페인 웹사이트와 크롤링을 통해 데이터셋을 만들었습니다. click 👉크롤&스티치 데이터 공개 “데이터 공개 텍스트 문서로, 스토킹 처벌법을 주제로 입법자 타깃으로 모은 것이기도 하고, 언론에서 스토킹을 다루는 모습을 모은 것 두 방향으로 진행했어요. 관련 기사를 긁어모았다는 의미에서 크롤(crawl), 페미니즘이 맥락적 지식이라는 의미가 있는데, 스토킹 기사에서 맥락을 만들고 연결했다는 뜻에서 스티치(stitch)라고 프로젝트 이름을 지었어요.” 현재 데이터셋은 초기 목표만큼 분석되지는 못했습니다. 제대로 된 통계도 없는 상태에서 무척 많은 양의 기사를 일일이 보며 맥락화를 해야 하므로 충분한 인력과 시간이 필요한 일입니다. 따라서 좀 더 제대로 된 연구 형태로 분석을 제안하고 전문적인 자료로 만들어 갈 계획입니다. click 👉 스토킹 입법 독려 사이트 2020년 12월 19일 기준, 21대 국회는 1,256일 남았습니다.  이 시간 안에 스토킹 처벌법 입법을 목표로 합니다. 입법 독려 사이트는 입법자를 타깃으로, 입법을 주요 목표로 오픈했습니다. 스토킹 처벌법이 입법되기까지 소요되는 시간을 드러내고 제대로 처벌 또는 법이 집행되지 않음으로써 문제가 된 사례들을 소개하고 있습니다. 사례들을 보면 스토킹 처벌법이 없는 한 이를 제대로 처벌하기 어렵다는 것을 알 수 있습니다. 그리고 21년간, 지난했으나 포기하지 않았던 발의 연혁을 보여줍니다. 발의 당시 국회의원들의 발언 내용이나 발의안을 보면 발의를 했음에도 불구하고 스토킹에 대한 인식이 매우 부족하...

발행일 2020.12.19.

[서로넷] 프로젝트 결과 - 앞으로도 계속 될 서로넷의 노동인권복지 이야기

서울 노동인권복지 네트워크(이하 서로넷)는 공익데이터 실험실 가을 스프린트에서 프로젝트 진행은 잠시 보류하고 지난 5월 진행한 설문조사 결과를 기초로 취약 노동자 심층 인터뷰를 진행했습니다. 그리고 향후 설문조사 등을 진행할 때 좀 더 나은 결과를 얻을 수 있도록 공익데이터 실험실 가을 스프린트의 지원으로 열린 사회조사기초 역량 강화 교육에 참여했습니다. 역량 강화교육은 지난 11월 중순 창덕궁 옆 아늑한 공간에서 ‘사회조사 기초’를 주제로 이루어졌습니다. 설문조사를 비롯한 통계 전반에 대한 기초 교육과 함께 지난 5월 진행한 설문조사를 좀 더 발전시킬 방안에 대한 설명을 듣고 질의응답을 나눴습니다. 현장 활동가들 스스로 현장의 이야기를 설문조사라는 방법을 통해 체계적으로 펼쳐 보이고 싶다는 욕구가 있었습니다. 하지만 인력과 시간, 비용의 한계가 있다 보니 대표성을 가진 많은 표본의 설문조사는 어려웠습니다. 이에 공공기관 등에서 작성한 통계자료를 접목하는 방식, 가능한 조직 단위를 이용하여 설문을 진행하는 방식 그리고 설문 문항을 체계적으로 설계하는 방식 등을 배우며, 앞으로도 코로나 19가 서울지역 노동자에게 미치는 영향을 비롯하여 취약 노동자들의 현실을 계속해서 관찰하고 드러내겠다는 열정을 보여줬습니다.   여기서는 서로넷이 설문조사 이후 진행한 취약 노동자 심층 인터뷰를 간략히 소개하며, 서로넷의 앞으로의 활동을 응원하는 마음을 전하고자 합니다. 노동실태조사 결과 심층 인터뷰 참여자들의 직업은 다양했습니다. 장애인 활동 보조사, 여행 상품 개발자, 온라인 쇼핑몰 노동자, 카페 아르바이트 노동자, 직업상담사와 타투이스트까지 코로나 19로 인해 타격을 입었을 것으로 흔히 예상되는 이들과 의외의 직업인들까지 많은 이들이 코로나 19에 따른 힘겨움을 토로했습니다. 이들에게는 코로나 19로 인한 노동시간 변화, 임금 변화, 휴가, 퇴사 이유 등과 함께 회사 사정으로 실직했을 경우 실업급여의 지급여부나 정부 재난 지원금 수령, 코로나 19가 바...

발행일 2020.12.19.

[내가버린쓰레기어디로 갈까?] 프로젝트 결과 - 쓰레기를 따라 걷는 여행, 그 막다른 종착역

"내가 버린 쓰레기 어디로 갈까" 프로젝트 최지 님의 “내가 버린 쓰레기 어디로 갈까” 프로젝트는 마지막 단계에서 크나큰 반전에 직면하고 말았습니다. 쓰레기와 관련한 수많은 공공데이터들이 있었지만 상당수가 모래성과 같아서 무너지기 쉬운 것들이었습니다. 프로젝트의 기본적인 아이디어, 즉 가정에서 배출된 쓰레기가 어떤 업체에 의해 수거되고 어디로 집적되며 어떻게 처리되는지 데이터를 통해 시각화해보고 싶다는 목표는 명쾌하고 시의성이 있는 것이었습니다. 하지만 아쉽게도 뒤늦게야 수집한 데이터들이 가진 문제들을 명확히 알게 되었습니다. 그러나 최지 님의 이러한 시행착오의 경험 자체가 교훈을 주고 있습니다. 우선은 해당 분야에 대한 배경과 맥락에 대한 충분한 지식 속에서 연구의 방향을 설정하고 데이터를 수집해야 한다는 것입니다. 처음부터 쓰레기와 관련한 데이터들이 수집되고 가공되는 맥락을 알고 있었다면, 프로젝트의 방향성을 다르게 설정했을지도 모릅니다. 혹은 충분한 지식을 프로젝트 이전에 습득할 수 없더라도, 프로젝트의 초기부터 해당 분야의 전문가와 만나서면서 연구의 제약조건들을 꼼꼼히 따지며 목표와 방향성을 실현가능한 것으로 수정해나갈 수 있었을 것입니다. 데이터 셋 더 중요한 것은 최지 님의 프로젝트의 궤적 자체가 데이터에 대한 근본적인 질문을 던진다는 점입니다. 데이터에 대한 피상적인 상식과는 달리, 데이터는 현실을 투명하게 반영하는 것이 아니라 가공을 거쳐 다루기 쉽게 만들어진 현실의 조각입니다. 최지 님이 봉착했던 문제 역시, 쓰레기와 관련된 데이터들이 체계적으로 관리되고 있었지만 raw data 수집의 수준에서 데이터의 신뢰성 문제가 있다는 점이었습니다. 사실 raw data 수준에서의 문제는 데이터 그 자체를 들여다보는 것만으로는 잘 보이지 않습니다. 최지 님이 이를 뒤늦게서야 알게 된 것도, 그만큼 특정한 데이터가 지닌 한계를 파악하는 게 그리 쉬운 일이 아니기 때문일 겁니다. 이는 결국 데이터 그 자체를 맹신하는 것을 경계하면서 데이터를 적절...

발행일 2020.12.18.

시민중심 도시데이터 생태계 구현 - 서울시 도시데이터서포터즈 운영 사례

서울시 도시데이터서포터즈 운영 사례 연사: 박건철 (서울디지털재단) 서울디지털재단에서는 현재 시민 중심의 도시데이터 생태계를 창출하기 위한 공익데이터 사업을 진행하고 있습니다. 이러한 도시데이터 생태계는 시민-서울시-기업의 순환구조를 구축함으로써 창출될 수 있습니다. 우선 시민들은 데이터를 수집하고 가공하는 과정에 참여하고, 그에 대한 보상을 제공받음으로써 소득 창출의 기회를 제공받을 수 있습니다. 서울시는 문제를 발굴하고 시민들이 수집한 데이터를 정리해 공유하는 역할을 담당합니다. 기업들은 이렇게 구축된 데이터 생태계를 바탕으로 데이터에 기반한 문제해결 서비스를 개발할 수 있게 됩니다. 즉, 수집 및 가공 → 개방 및 공유 → 문제해결의 프로세스가 이뤄지는 과정 속에서 데이터 생태계를 형성될 수 있습니다. 디지털재단의 서울시 도시데이터서포터즈는 이러한 목적 하에서 시민들의 참여를 이끌어내기 위한 사업입니다. 도시데이터 생태계 창출 (자료: 박건철 님 프레젠테이션) 데이터 수집은 크게 두 가지 과정을 통해 이뤄질 수 있습니다. 하나는 기계중심 접근으로, 프로그램을 통해 SNS, 댓글, 뉴스 등 온라인상의 수많은 빅데이터들을 자동 수집하거나 기존에 공공에서 축적된 데이터들 가운데 새로운 활용가치가 있는 데이터를 발굴하는 방식입니다. 그러나 기계가 모든 걸 다 할 수는 없기에, 인간중심 접근이 필요합니다. 인간중심 접근은 시민참여를 통해 원시데이터와 인공지능의 학습데이터를 확보하는 것입니다. 이런 인간중심 접근을 통해 시민들이 데이터를 만들어낸 사례들은 이미 매우 다양합니다. 가령 독일 베를린에서는 시민들이 체감하는 거리의 위험 수준(교통사고, 밤거리 등)을 측정하고, 이렇게 모여진 데이터를 통해 가로등, 횡단보도 설치나 순찰로 재설정 등 도시계획에 반영한 사례가 있습니다. 시민들의 위험에 대한 체감 수준은 기계가 센서로 측정할 수 없지만, 시민들이 일상에서 데이터를 수집함으로써 데이터 축적이 가능해진 것입니다. 기계중심 접근/인간중...

발행일 2020.12.18.

언론의 눈으로 본 공익데이터실험실 가을스프린터

언론의 눈으로 본 공익데이터실험실 가을스프린터 연사: 클루KLOU (뉴스타파 데이터분석팀) 데이터 액티비즘이란, 데이터를 수집하고 분석하여 이를 통해 정치적인 목적을 달성하려는 활동이라고 할 수 있습니다. 이 데이터 액티비즘과 관련하여 공익데이터 실험실 가을스프린트에서 진행된 네 개의 프로젝트들은 아주 의미 있는 사례입니다. 이 프로젝트들의 진행과정과 결과를 평가하면서 각각의 강점과 한계, 그리고 함의들을 짚어보고자 합니다. 또한 앞으로도 진행될 공익데이터 실험실에 대해서도 일정한 교훈과 제언을 제시해보고자 합니다. [그림1] 공익데이터 실험실 가을 스프린트   스몰빅 팀의 <국내 장애아동의 차별 없는 놀 권리 증진을 위한 그린 북(Green Book)> 프로젝트 스몰빅 팀의 경우 우선 멤버들 중에 시민단체 활동가들이 많았기에, 팀원들이 활동 경험이 있다는 게 강점이었습니다. 반면 다들 데이터를 다뤄본 경험은 부족한 상태였습니다. 그렇기에 실제로 스몰빅 팀은 프로젝트 과정에서 지속적으로 빠띠나 자문회의에 데이터 시각화와 관련된 기술적 도움을 많이 요구했습니다. 하지만 기술적인 것보다 더 근본적인 부분이 프로젝트의 발목을 잡았습니다. 스몰빅 팀은 자원봉사자 그룹을 조직하여 놀이시설들의 현장조사를 통해 데이터를 수집했습니다. 놀이시설들을 평가할 지표를 설정하고 해당 지표를 통해 시설들의 등급을 분류해 시민들에게 정보를 제공하고자 했습니다. 그러나 문제는 애초에 장애 친화적인 시설들이 거의 전무하다는 점이었습니다. 즉, “괜찮은 시설이 어디에 있는지” 정보를 제공하려던 초기의 목적과 달리, “좋은 시설이 한 곳도 없다”는 메시지가 프로젝트의 결론이 되어버린 것이죠. 핵심 메시지가 데이터 바깥에 위치하게 된 상황이었습니다. 그럼에도 현장조사를 통해 수집한 데이터들을 맵핑 형태로 시각화하여 공개했습니다. 또 노션 페이지에 그동안 조사했던 이상적인 놀이터의 모습을 담아내 소개하고자 했습니다. 그러면서 이슈레이징을 통해 강서구의 ...

발행일 2020.12.18.

AI 이미지 학습을 위한 데이터 라벨링

11월 마지막 토요일, 공익데이터 실험실 가을 스프린트의 마지막 장 특별교육 세션이 진행되었어요. 특히 요즘 디지털 뉴딜 사업으로 많은 관심을 받는 데이터 라벨링과 AI 주제도 있었습니다. 실제 현장에서 인공지능 데이터와 소프트웨어 테스트를 전문으로 하는 사회적기업 테스트웍스 이선민 매니저님께서 데이터가 활용되기 위해 수집되고 가공되는 방법에 대한 소개를 해주셨습니다. 4차 산업혁명의 DNA 4차 산업혁명에서는 Data - Network - Artificial Intelligence가 어우러져 혁신이 일어나고 있습니다. 자율주행기술, 핀테크, 헬스케어, 드론, 감성인지, 통·번역 등 다양한 분야에서 인공지능은 사용되고 있습니다. 이처럼 우리 생활에 영역을 확장해나가는 인공지능과 데이터를 위해 무엇이 꼭 필요할까요? AI 개발에는 정확하고 좋은 품질의 데이터, 다량의 데이터를 수집/가공하는데 80% 이상의 시간이 든다고 합니다. 인공지능 또한 성능이 좋아지려면 많은 양의 데이터를 학습해야 하기 때문입니다. 또한, 정확한 데이터도 무척 중요합니다. 가령 강아지의 얼굴을 라벨링 할 때 실수로 눈을 코로 입력하는 순간, 학습력은 떨어지게 됩니다. 그래서 (1) 다량의 데이터, (2) 정확히 가공된 데이터가 AI 학습을 위해 꼭 필요합니다.  그 다음으로 가공된 데이터를 철저히 검수하는 과정이 필요해요. 이런 과정이 부족하다면, 자율주행차가 사람을 친다거나, AI가 편견을 학습하는 등 잘못된 결과로 이어질 수도 있습니다. 라벨링 도구와 방법 테스트웍스에서는 자체 개발한 라벨링 도구를 사용해서, AI 학습을 위한 이미지 태깅과 라벨링 작업을 합니다. 주로 아래와 같은 기능이 있어요. 가령 박스 기능은 주석을 달고 싶은 특정 객체를 사각형 모양으로 캡처하는 방법입니다. 아래 그림을 보면 자동차들이 줄을 서 있는데, 네모 박스로 태깅을 하고 car라고 라벨링을 합니다. 컴퓨터는 이렇게 사진 속에 담긴 태깅과 라벨링 정보를 통해 학습하게 됩니다.  ...

발행일 2020.12.18.

설문조사! 우리가 직접 하고 싶을 때 ‘꼭’ 알아야 할 것들: 사회조사 기초 강의

지난 11월 17일 오후, 창덕궁의 가을 풍경이 창밖으로 펼쳐진 아늑한 공간에서 서울노동인권복지네트워크(이하 서로넷)를 위한 <통계설문 데이터 읽기 분석-사회조사 기초> 교육이 진행되었습니다. 미국 시카고대학에서 사회학을 공부 중이며, 코로나 19를 잠시 피해 한국에서 논문을 준비 중인 조홍진 님께서 강의를 해주셨어요. 서로넷 참여 네트워크 중 한국비정규노동센터, 서울시 감정노동종사자 권리보호센터, 서울노동권익센터 관계자들과 함께 약 2시간 동안 강의를 들었는데요, 그 내용과 질의응답 등을 정리해서 공유해드립니다. 강의는 사회조사란 무엇이고 어떻게 이루어지는가에 대한 필수 개념 소개, 사례 탐구, 사회조사를 위한 다양한 접근 방법들을 소개로 이루어졌습니다. 그리고 서로넷이 지난 5월 진행한 설문조사에서 어떻게 하면 좀 더 유의한 답변을 얻을 수 있을 것인가에 대한 개선안을 제안하셨어요. #1. 사회조사란 무엇인가? 사회조사에는 세가지 목적이 있습니다.  첫째, 탐색(exploration)적인 목적입니다. 예를 들어, 조사하고자 하는 현상이 있는가, 없는가에 관해 질문을 던집니다. 다만, 작은 케이스 중심이라 대표성에 한계가 있는 경우가 많습니다. 둘째, 현상을 기술(description)하는 것입니다. 가령 인구조사(census) 등이 있는데요. 무엇이, 어디서, 언제, 어떻게 등의 항목에 따라 현상을 기술하는 것이지요. 셋째, 현상을 설명(explanation)하는 것입니다. 왜 이런 현상이 벌어지는가를 인과관계 중심으로 설명하는 것이지요. 조사를 할 때는 분석단위 즉 조사 대상을 설정하게 됩니다.  조사 대상은 개인, 집단, 조직일 수도 있고, 사회적 상호작용이나 사회적 가공물인 경우도 있어요. 사회적 가공물이란 예를 들어 어린이 책에서 성 역할을 어떻게 설명하고 있는가 등을 조사의 대상으로 삼는 것입니다. 분석과정에서 분석단위와 결론의 연결에서 빠지기 쉬운 오류가 있습니다. 첫 번째는 생태학적 오류(ecological fal...

발행일 2020.12.03.