데이터 사이언스 Meetup
1. 데이터 사이언스 Meetup 출범
R Meetup을 시작점으로 출발을 했지만, Meetup에 오시는 분들은 대부분 데이터 사이언스 문제를 풀려고 하는 학생이나 실무에 계신 분들이 많아 이에 부합되도록 Meetup 운영을 변경하게 되었습니다.
Tidyverse Korea와 PRESSer 공동으로 R Meetup 시즌2를 2018년 11월부터 시작했습니다. 2019년부터 "데이터 사이언스" Meetup으로 출발하게 되는 이유는 크게 두 가지입니다. 먼저 R 언어로 코딩하면서 발표하시는 분을 연사로 모시는 것이 어려웠습니다. R Meetup 시즌1부터 같은 연사분이 계속 발표를 진행함으로써 피로감이 깊어지는 것이 "데이터 사이언스 밋업"으로 확대하게된 직접적인 이유입니다. 다른 한편으로는 R Meetup에 오시는 분들이 R보다는 "데이터 사이언스" 문제를 갖고 계신 분이 많다는 것이 그동안 밋업을 운영하면서 알게 되었습니다. "데이터 사이언스"에 대한 저변이 확대되어 사회적인 호응도 있는 것으로 판단되고, 특히 reticulate
, keras
, sparklyr
등 다양한 R 팩키지가 출현하면서 더 이상 R, 파이썬 등 언어중심으로 Meetup을 나눠 진행하는 것은 무의미해졌기 때문입니다.
2. 9월 데이터 사이언스 Meetup 모임 안내
데이터 분석가와 과학자들이 만나 피자와 가벼운 맥주를 마시면서 세미나 듣는 방식으로 진행됩니다. R 뿐만 아니라 파이썬을 비롯한 데이터 사이언스 하시는 분들이 모이는 밋업입니다.
- 일시 : 2019년 9월 18일 (수요일) 19:00 ~
- 장소 : 스파크플러스 역삼점 (선릉점에서 역삼점으로 변경됨)
- 서울특별시 강남구 역삼동 테헤란로 201 스파크플러스 역삼점 (역삼역 8번 출구)
- 발표 :
- 이광춘(삼정KPMG): "문서를 이해하는 AI"
- 이재화(경희대): "케라스를 활용한 RNN & LSTM 자유로운 모델링 방법"
- 나성호(한양대): "R로 하는 RPA"
- 윤정환(OP.GG, 오피지지): "이스포츠에서의 데이터 분석"
- 도서 후원
- 우정훈 (KPMG), AI 사람에게 배우다 - 인공지능이 만드는 기업의 미래 (2권)
- Do it! 쉽게 배우는 R 데이터 분석 (1권)
- 제이펍 1권 - "R로 배우는 텍스트 마이닝: tidytext 라이브러리를 활용하는 방법"
- 이현열 - R을 이용한 퀀트 투자 포트폴리오 만들기, 제이펍 2권
- 참가신청: 등록 사이트 9월1일 티켓 오픈
- 세미나 참석자(1만원), 뒷풀이 참가자(3만원)
- 뒷풀이 장소: 도쿄짬뽕0820 선릉1호점
- 주소: 서울특별시 강남구 테헤란로63길 8 (서울특별시 강남구 삼성동 142-5), 02-555-0927
3. 발표주제 및 발제자를 모십니다.
발표주제 및 발제자를 직접 적어 주세요.
<iframe name="embed_readwrite" src="https://etherpad.net/p/tidyverse?showControls=true&showChat=true&showLineNumbers=true&useMonospaceFont=false" width=600 height=400>
5. 데이터 사이언스 Meetup
요일 | 발표자 | 주제 | 발표자료 | 비고 |
---|---|---|---|---|
2019.08.21(수) | 이광춘 | "tidyverse 모형 tidymodels " |
발표자료 | |
한수미/남내현 | "사학 학술연구논문 빅데이터 분석-키워드와 토픽모델링 분석을 중심으로" | 발표자료 | ||
설현수 | "jamovi 통계 프로그램 소개" | 발표자료 | ||
안상선 | "위험하지 않은 마약 데이터 흡입 수기 : 마약으로 인한 사회적 비용 모형 추계 사례" | 발표자료 | ||
2019.07.24(수) | 이광춘 | "앙상블 모형: R vs. Python" | 발표자료 | |
안중호 | "마케터를 위한 빅데이터" | 발표자료 | ||
이현열 | "데이터사이언스로 이해하는 퀀트" | 발표자료 | ||
이민호 | "데이터분석가의 가벼운 개발환경 : Ipad로 작업해보기" | 발표자료 | ||
2019.06.19(수) | 이광춘 | "데이터 과학자의 글쓰기 - 재현가능한 논문작성" | 발표자료 | |
서희 | "Reactlog로 Shiny 쉽게 디버깅하기" | 발표자료 | ||
문건웅 | "Conditional Process Analysis using R" | 1번, 2번, 3번, 4번 | ||
2019.05.15(수) | 어수행 | "Python에서 EMR데이터 (생존)분석" | 발표자료 | |
김지연 | "너의 기분 이모지(emoji)? - 감정기반 이모지 추천 시스템" | 발표자료 | ||
홍원준 | "의료데이터 기반의 데이터서비스 개발기" | 발표자료 | ||
송효진 | "Tidyverse Before and After" | 발표자료 | ||
2019.04.24(수) | 이광춘 | (한국) 데이터 과학자의 클라우드 서비스 | 발표자료 | |
정도현 | 데이터 과학자를 위한 AWS 서비스 소개 | 발표자료 | ||
임상배 | Sparklyr을 활용한 R 코드 분산 처리 | 발표자료 | ||
홍운표 | Changes and benefits of Automated ML by DataRobot | 발표자료 | ||
2019.03.20(수) | 이광춘 | 금융 빅데이터 시각화 - KOSPI |
발표자료 | |
유제성 | 운영인력 최적화를 위한 HR Analytics | 발표자료, R코드 | ||
이승준 | S&P500 데이터 수집과 분석 | 발표01,발표02 | ||
안상선 | 이상하고 비정상적이고 괴랄한 금융 시계열 분석 | 발표자료 | ||
2019.02.20(수) | 이광춘 | 자연어 처리는 R로 가능한가? | 발표자료 | |
나성호 | 카카오 지도 API 핸즈온 | 발표자료 | ||
어수행 | Self-supervised learning for surgical vision data | 발표자료 | ||
2019.01.23(수) | 김설기 | R for Data Science | 발표자료 | |
나영준 | R for animal science: project adatalab |
슬라이드쉐어, GitHub | ||
김준혁 | RcppMeCab 은 왜 만들었나? |
발표자료 | ||
차석근 | 스마트공장 및 데이터 분석 | 발표자료 | ||
2018.12.20(목) | 이광춘 | 데이터 과학자가 바라본 사기 탐지(Fraud Detection) | 발표자료 | |
나성호 | 2018 프로야구 기사로 살펴본 이모저모 | 발표자료 | ||
최진영 | AutoML과 머신러닝 툴 개발/사업화 과정의 어려움 | 발표자료 | ||
2018.11.22(목) | 이광춘 | 설명가능한 기계학습 | 발표자료 | 클라우데라 |
나성호 | 기업리뷰 분석 시리즈 | 1 2 3 | 순천향대학교 |
6. R Meetup X 캐글 시즌 1
xwMOOC R Meetup은 KRUG 1,2대 회장을 역임한 유충현님을 모시고 xwMOOC 이광춘, 캐글뽀개기 이상열이 십시일반 노력을 하여 2017년 8월 ~ 2018년 5월까지 매월 총 10회 진행되었습니다. KossLab(공개SW 개발자센터)의 공간지원을 받아 나름 쾌적한 환경에서 R 사용자들이 모여 즐거운 배움과 네트워킹 시간을 갖게되었습니다.
요일 | 주제 | 발표자 | 발표자료 | 비고 |
---|---|---|---|---|
2017.08.23(수) | 감성분석(Sentiment Analysis) - 깔끔한 텍스트 방식(tidytext) | 이광춘 | 발표자료 | |
modelr | 이상열 | 발표자료 | ||
2017.09.20(수) | 쉽게 배우는 R 데이터분석 | 김영우 | 발표자료 | |
재현가능한 연구를 위한 데이터 과학 제품 개발 | 이광춘 | 발표자료 | ||
한글 텍스트데이터 분석 | 류충현 | 발표자료 | ||
2017.10.18(수) | R 로 웹 데이터를 가져오는 4가지 방법(은 크롤링) | 박찬엽 | 발표자료 | |
데이터과학 블로그 10분 완성 | 이광춘 | 발표자료 | ||
테드(TED) 에듀데이터 분석 | 한수미 | 발표자료 | ||
Shiny의 기본 원리와 이해 | 김승욱 | 발표자료 | ||
2017.11.15(수) | 통계모형 시각화 | 이광춘 | 발표자료 | |
R언어 역사 | 이광춘 | 발표자료 | ||
catboost 소개 | 이상열 | 발표자료 | ||
2017.12.21(목) | LASSO regresion을 이용한 Taxonomy | 류충현 | 발표자료 | |
메타분석(Meta analysis) | 김가경 | 발표자료 | ||
시계열 데이터 예측 | 이광춘 | 발표자료 | ||
2018.01.17(수) | h2o 소개 | 황문기 | 발표자료 | |
Spark R 소개 | 지용기 | 발표자료 | ||
Code Snippets: batch jobs in R(라이트닝 토크) | 어수행 | 발표자료 | ||
Code Snippets:R 암호화폐 | 이광춘 | 발표자료 | ||
2018.02.21(수) | 빅데이터는 디스크에 쓰고 R 메모리라고 읽는다 | 이광춘 | 발표자료 | |
한국 영화배우 데이터로 만든 한국판 케빈 베이컨 놀이 | 나성호 | 발표자료 | ||
데이터 정규화를 통한 Feature Selection | 장윤경 | 발표자료 | 부존재 | |
2018.03.21(수) | R과 shiny를 이용한 web application 제작 | 문건웅 | 발표자료 | |
Shiny Drill Down | 이희재 | 발표자료 | ||
Rstudio 컨퍼런스 후기 | 양승훈 | 발표자료 | ||
2018.04.25(수) | 언론사 데이터 저널리즘 | 배여운 | 비공개 | |
데이터는 알고있다 | 김영우 | 발표자료 | ||
백 마디 말보다 그래프 하나 - ggplot | 이광춘 | 발표자료 | ||
라이트닝 토크 - 에너지 데이터 분석 | 김설기 | 발표자료 | ||
라이트닝 토크 - 뉴스기사 솔루션 (키워드, 문장요약, 분류기) 소개 | 황문기 | 발표자료 | ||
2018.05.23(수) | R 패키지: 신규 패키지 소개 - dlookr | 류충현 | 발표자료 | |
CRAN으로 거쳐가는 정거장 - Github suggetR 패키지 | 이광춘 | 발표자료 |
xwMOOC 오픈 교재
- 컴퓨팅 사고력(Computational Thinking)
- 데이터 과학
- 기계학습, 딥러닝, 인공지능
- IoT 오픈 하드웨어(라즈베리 파이)
- 선거와 투표