안녕하세요. 도넛쌤입니다.
이번에는 조금 특별한 주제로 찾아뵙네요! 이번에 소개해 드릴 주제는 ‘공공데이터를 활용한 데이터 과학’입니다. ‘공공데이터를 활용한 데이터 과학’은 앞으로 정보쿠키에서 정기적으로 발행할 예정이에요. 이번 시간에는 본격적인 파이썬 실습 전 중학교 시절 배운 엔트리로 데이터를 분석해 보며 데이터 과학에 대한 감을 익혀 보는 가벼운 실습으로 구성해 보았습니다.
자 여러분들이 500년 전 조선 시대 주모가 되었다고 생각하고 아래 시트를 살펴보세요.
‘아래의 데이터에서 일주일 동안 팔린 메뉴의 종류는 몇 개일까요?’
이 질문에 답하기 위해 여러분은 A4 용지에 메뉴를 하나씩 정리하기 시작합니다.
▲ 판매 데이터의 일부
<aside> 💡
조선시대 주모가 만든 알고리즘
① 2번째 줄의 메뉴이름 ‘참치마요김밥’을 A4 용지에 메뉴종류 리스트에 추가하기 ② 3번째 줄의 메뉴이름 ‘돈가스김밥’을 A4 용지에 메뉴종류 리스트에 추가하기 ③ 4번째 줄의 메뉴이름 ‘참치마요김밥’이 A4 용지에 메뉴종류 리스트에 있기 때문에 추가하지 않기(메뉴종류를 알기 위함이기 때문에 추가하지 않는다.)
→ 자, 이렇게 785번째 줄까지 반복적으로 작업을 합니다… 이런 작업을 정말 사람이 해야 한다면 굉장히 오래 걸리겠죠? 그리고 무엇보다도 결과가 정확하지 않을 수 있어요. 자, 이런 문제는 어떻게 해결해야 할까요? 바로 데이터 과학!!! 엔트리로 이러한 문제를 해결하여 보아요.
</aside>
여러분들이 중학교에서 배운 엔트리에도 데이터를 분석할 수 있는 기능이 있어요. 지금부터 785개의 분식집 데이터를 10초 만에 해결하는 마술(데이터 과학)을 보여드리겠습니다.
<aside> 💡
실습 개요
</aside>
플레이 엔트리 (https://playentry.org/#!/) 계정에 로그인하여 클라우드 공간에 작업물을 저장하면, 오늘 실습한 내용을 언제 어디서나 플레이 엔트리에 접속하여 볼 수 있어요.(클라우드 👍)
① 플레이 엔트리 사이트에서 [로그인] 버튼을 클릭하여 로그인을 진행합니다.