Overview



R is an open source software and programming language for data ingestion, data processing, exploratory data analysis, statistical modeling, visualization and machine learning among other things. Recently, as the term “data science” has emerged to describe collectively these tasks, R has also become the primary tool of choice for data scientists. The Tidyverse Seoul R meetup brings together local users of R and featuring talks with world-class speakers while creating fruitful networking opportunities for its members.


Sponsors

2021

Column

Overview



  • When: Wednesday, January 13, 2021 7:00 PM to 9:00 PM GMT+9
    • RSVP opens Wednesday, December 30, 2020 7:00 PM**
  • Where: Online Event - Link visible for attendees
  • Seoul R Users: 2021 - January



  • Schedule
    • 6:30 open zoom
    • 7:00-7:30 Presentation Talk 1
    • 7:30-8:00 Presentation Talk 2
    • 8:00-8:30 Presentation Talk 3
    • 8:30 ~ 9:00 Virtual Social



January (1월)



  • Talk (25min talk, 5min Q&A)
    • Title: “Data Science with R and Python”
    • Korean Title: “R과 파이썬 데이터 과학”
    • Speaker: 이광춘(Kwangchun Lee)
    • slidedeck
    • Abstract: R 혹은 파이썬이 데이터 과학에 더 적합하고 어떤 데이터 과학 언어가 평정할 것이냐는 전쟁은 이제 새로운 세대를 맞고 있습니다. 데이터 과학을 어떤 언어로 하느냐가 중요한 것이 아니냐 풀려고 하는 문제를 어떻게 데이터 과학 문제로 정의하고 데이터 과학 언어로 문제를 풀면 되지 않느냐는 주장이 설득력을 얻고 있으며 몇년전부터 개발되기 시작한 reticulate가 두 진영을 이어주는 핵심 팩키지로 자리를 잡아가고 있습니다.
  • Talk (25min talk, 5min Q&A)
    • Title: “Medical Research Support with R/shiny”
    • Korean Title: “Shiny 활용 의학연구지원”
    • Speaker: 김진섭(JinSeoup Kim)
    • slidedeck
    • Abstract: 의과대학, 보건대학원, 삼성전자를 거치면서 다양한 건강데이터를 다룬 경험을 바탕으로 연구지원법인 차라투를 설립, R/Shiny 로 의학연구자들을 지원 중입니다. Shinykorea 의 진행과 후원을 맡아 의료/축산/게임/반도체/신용평가/IPTV 등 다양한 분야의 사람들과 함께 Shiny 를 알아가는 중입니다.
  • Talk (25min talk, 5min Q&A)
    • Title: Simple AutoML Starting with KubeFlow
    • Korean Title: “KubeFlow로 시작하는 간단한 AutoML”
    • Speaker: 이승우
  • Talk (25min talk, 5min Q&A)
    • Title: “Data Analysis with KNIME”
    • Korean Title: “KNIME을 이용한 데이터분석” + \(\alpha\) "Shiny 이용 모바일앱 개발
    • Speaker: Nam-Hyeon Jee (지남현)
    • shinyMobile 소개, KNME 소개, knime_study_workflow, KNIME Cheatsheet
    • Abstract 1 : KNIME Analytics Platform은 GUI workflow 기반으로 데이터 선택부터 전처리, 변환, 분석, 모델링, 평가, 시각화 까지 일련의 분석 과정을 손쉽게 작업할 수 있는 분석 플랫폼으로, 독일의 Konstanz University에서 Java로 2004년 부터 개발해 온 오픈소스 프로그램 입니다.
    • Abstract 2 : shinyMobile은 shiny용 대시보드 (shinydashboardplus, bs4Dash, argonDash 등) 패키지를 만든 RinteRface에서, Framework7 템플릿 기반으로 만든 모바일용으로 shiny 대시보드 패키지 입니다.

February (2월)





  • Schedule
    • 6:30 open zoom
    • 7:00-7:30 Presentation Talk 1
    • 7:30-8:00 Presentation Talk 2
    • 8:00-8:30 Presentation Talk 3
    • 8:30 ~ 9:00 Virtual Social



  • Talk (25min talk, 5min Q&A)
    • Title: “Crawling the United States stock data”
    • Korean Title: “미국주식 데이터 수집”
    • Speaker: 이현열
    • slidedeck
    • 초록: 투자를 하기 위해서는 우선 그 기업이 무엇을 하는지, 즉 데이터를 수집해야 합니다. 데이터만 있다면 국내 뿐만 아니라 미국, 혹은 우리가 한번도 들어보지 못했던 동유럽이나 동남아에도 투자가 가능합니다. 크롤링을 이용한다고 이러한 데이터를 얼마든지 무료로 수집할 수 있습니다. 또한 데이터를 기반으로 투자를 한다면 시장의 광끼과 공포에 휘둘리지 않는 장점도 있습니다.
    • Abstract: To invest, first, you have to collect what the company does: data. If you have data, you can invest not only in Korea but also in the United States, or in Eastern Europe or Southeast Asia, which we have never heard of. You can collect these data for free by using web crawling. And if you invest based on data, you have the advantage of not being overwhelmed by the market’s greed and fear.
  • Talk (25min talk, 5min Q&A)
    • Title: “GIS Data Handling Using R”
    • Korean Title: “R을 이용한 GIS 데이터 핸들링”
    • Speaker: 하헌철
    • Abstract:GIS Data 전반에 대한 내용을 처음 접하는 데이터분석가를 상정하여 소개하는 내용입니다. 기본적인 R 지식은 갖추고 있다는 전제 하에, 더 깊은 내용을 구글링하고 이해하기 위한 기초적인 지식 그리고 실무 예제들을 소개합니다.
    • slidedeck
  • Talk (25min talk, 5min Q&A)
    • Title: Case Study: Time Series Analysis with R
    • Korean Title: “돈이 될지도 모르는 암호화폐의 변동성 분석”
    • Speaker: 안상선(SangSun Ahn)
    • paper
    • Abstract: 암호화폐의 가격정보가 금융시장에서 투자정보로서 역할을 하기 위해서는 첫째, 암호화폐 가격정보가 우리의 연구 대상은 주식시장과 관련이 있어야 한다. 이를 위해서 암호화폐의 가격 정보와 우리나라의 종합주가지수(KOSPI지수)와의 관계를 살펴본다. 둘째, 사전 정보로서 가능성을 검증하기 위해 과거 시점의 암호화폐가격정보와 현재 주식시장의 가격변수와의 관계를 살펴본다. 이는 암호화폐 가격이 예측가능성 있는 투자지 표로서 역할을 할 수 있는지를 검증한 것이다. 셋째, 불확실성이 높은 상황에서도 암호화폐의 가격정보가 투자지표로서 역할을 할 수 있는지 검증한다. 금융 연구에서는 1999년 동아시아의 금융위기, 2008년에 미국발 금융위기 등과 같은 비일상적인 상황에서 금융 시장을 다룬 연구가 많다. 여기서는 코로나19 팬데믹 선언을 한 2020년 1월 29일을 기점으로 그 이전과 이후로 기간을 나눴으며, 2기간 간에 암호화폐 가격의 정보의 효율성을 비교했다.

March (3월)



  • When: **Wednesday, March 10, 2021 7:00 PM to 9:00 PM GMT+9
  • Where: Online Event - Link visible for attendees
  • Seoul R Users: 2021 - March



  • Talk (25min talk, 5min Q&A)
    • Title: “Data Visualization Happening”
    • Korean Title: “데이터 시각화 해프닝”
    • Speaker: 송효진(HyoJin Song)
    • 초록: 본 세션은 데이터를 시각화 할 때 일어나는 일들과 위험요소들이 무엇이 있었는지 과거경험을 통해 이야기 합니다. 특히 최근데이터를 이용하여 갱신되는 구조의 대시보드 형 리포트를 만들 때 일어날 수 있었던 일(해프닝)들과, 이에 대한 견해를 공유합니다. 데이터 시각화시 일어날 수 있는 사건들의 해프닝들을 반면교사 삼아 미리 대비하고 염두해두어야 할 부분들이 무엇이 있는지 기초적인 10가지 주제를 요약정리하여 발표를 통해 알려드립니다.
    • slidedeck, PDF, keynote
  • Talk (25min talk, 5min Q&A)
    • Title: Data analysis begins with data quality diagnosis and exploratory data analysis.
    • Korean Title: 데이터 품질 진단과 EDA
    • Speaker: Choonghyun Ryu (유충현)
    • 초록: 데이터 분석의 시작은 데이터 품질 진단과 탐색적 데이터 분석부터 시작합니다. dlookr 패키지는 데이터가 분석을 수행할 품질을 만족하는지 진단하고, 개별 변수에 숨겨진 특징 이해하기 위한 EDA 작업을 도와줍니다. dlookr 패키지의 새로운 기능을 소개하고, tidyverse 패키지와 협업하는 방법을 제시합니다.
    • Abstract: The dlookr package diagnoses whether the data meets the quality to perform the analysis, and helps EDA work to understand the hidden features of individual variables. Introduces new features of the dlookr package and shows you how to collaborate with the tidyverse package.
    • slidedeck
  • Talk (25min talk, 5min Q&A)
    • Title: “How to easily analyze text data”
    • Korean Title: “텍스트를 쉽게 분석하는 방법”
    • Speaker: 김영우 (Young-Woo Kim)
    • Abstract: Text data can also be analyzed easily in tidy way. From Tokenization, Morphological analysis, and calculating TF-IDF to creating network graphs, this talk introduces how to analyze text data in tidy way.
    • 초록: 텍스트 데이터도 tidy한 스타일로 다루면 쉽게 분석할 수 있습니다. 토큰화, 형태소 분석, TF-IDF 계산부터 네트워크 그래프를 만드는 작업까지, tidy한 방법으로 텍스트를 분석하는 방법을 소개합니다.
    • “Do it! 쉽게 배우는 R 텍스트 마이닝” 이지스 퍼블리싱 출판사 책 2권 증정
    • slidedeck

April (4월)



  • When: **Wednesday, April 14, 2021 7:00 PM to 9:00 PM GMT+9
  • Where: Online Event - Link visible for attendees
  • Seoul R Users: 2021 - April



  • Talk (25min talk, 5min Q&A)
    • Title: “데이터 과학 워드 프로세서”
    • Korean Title: “Word Processor for Data Science”
    • Speaker: 이광춘(Kwangchun Lee)
    • Abstract: RStudio announced that RStudio v1.4 has provided “Visual Markdown Editing”. With this feature data scientists can focus on technical writing itself such that they can improve documents quality. In this short talk, “Visual Markdown Editing” feature will be presented and Korean language supporting experiences will be shared.
    • 초록: Visual R Markdown 편집기능이 RStudio v1.4에 포함되면서 글쓰기에 좀더 집중을 하면서 전반적인 데이터 과학 문서 품질향상에 획기적인 변화가 생겨 새롭게 추가된 획기적인 Visual R Markdown 기능과 한국어를 반영할 수 있는 방법을 함께 고민하고자 합니다.
    • slidedeck
  • Talk (25min talk, 5min Q&A)
    • Title: Propensity score analysis using R
    • Korean Title: R기반 성향점수분석
    • Speaker: 박인서
    • Abstract: Most social sciences data are collected through observational studies, without experimental manipulation. Under the circumstances, propensity score analysis allows us to make valid causal inferences. This talk will introduce main concepts and crucial steps in propensity score analysis.
    • 초록: 대부분의 사회과학 데이터는 실험설계를 따르지 않는 관측연구 상황에서 얻어집니다. 이러한 관측연구 상황에서 타당하게 인과관계를 추론할 수 있는 방법으로 성향점수분석 기법을 소개합니다. 성향점수분석에서 등장하는 핵심 개념들을 알아보고, R에서 주요 진행 절차를 실습해보겠습니다.
    • slidedeck
  • Talk (25min talk, 5min Q&A)
    • Title: “DataRobot’s Location AI, ease of featurizing”
    • Korean Title: “DataRobot의 위치정보를 활용한 모델링”
    • Speaker: 홍운표(WoonPyo Hong)
    • Abstract: What and how are the available ways of feature engineering at location-relevant features in R? Review some cases in pure R scripting, we’ll consider DataRobot’s Location AI plus R API which is a good alternative to the existing approach as an enterprise AI platform.
    • 초록: 위치정보가 포함된 데이터를 활용하여 모델링할 때 R usage를 살펴보고, 이의 대안으로 Enterprise AI Platform인 DataRobot의 Location AI 기능과, R api를 활용하는 방법을 소개합니다.
    • slidedeck

2020

Column

Overview



  • When: Friday, December 11, 2020 7:00 PM to 9:00 PM GMT+9
    • RSVP opens RSVP opens Friday, November 27, 2020 7:00 PM
  • Where: Online Event - Link visible for attendees
  • Seoul R Users: 2020 - December



  • Schedule
    • 6:30 open zoom
    • 7:00-7:30 Presentation Talk 1
    • 7:30-8:00 Presentation Talk 2
    • 8:00-8:30 Presentation Talk 3
    • 8:30 ~ 9:00 Virtual Social



September (9월)



  • When: Wednesday, September 9, 2020 7:00 PM to 9:00 PM GMT+9
    • RSVP opens Wednesday, August 26, 2020 7:00 PM
  • Where: Online Event - Link visible for attendees
  • Seoul R Users: 2020-September



  • Talk (25min talk, 5min Q&A)
    • Title: Why Tidymodels
    • Korean Title: 왜 당근(caret)은 안되고 새로운 신상 당근(Tidymodel)인가?
    • Speaker: Kwangchun Lee (이광춘)
    • slide deck
    • Abstract: Tidyverse is regareded as a new framework, ecosystem, thought leader for data science. Tidyverse also has a profound effect on models. When Max Kun moved to RStudio, perhaps the Tidymodels has begun. Now Tidymodels have become the standard of ML.
    • 초록: Tidyverse는 데이터 과학을 위한 새로운 프레임워크, 생태계, 리더로 받아들여지고 있다. ML 분야도 Tidyverse 영향을 벗어날 수 없었다. Max Khun 박사가 RStudio로 자리를 옮기는 시점부터 아마도 Tidymodels의 시작으로 볼 수 있고 몇년이 지나 Tidymodels는 ML 의 표준으로 자리잡아가고 있다.
  • Talk (25min talk, 5min Q&A)
    • Title: “MLOps with R: Collaboration of data scientists & developers/engineers”
    • Korean Title: “R에서 MLOps 시작하기: 데이터 과학자 & 개발자/엔지니어 협력”
    • Speaker: Ian Choi (최영락)
    • Abstract: Machine Learning Operations (MLOps) process becomes critical for reliable and efficient deployment of applications that depend on R-based models. This talk explains and demonstrates MLOps from DevOps story by dividing into three R components: 1) data upload, 2) machine learning model training & deployment, and 3) visualization with Shiny with Azure Machine Learning Service and GitHub Actions.
    • 초록: 한글: R 기반 모델로 만들어진 데이터 분석 & 머신 러닝 모델을 안정적이고 효율적으로 지속적인 배포를 위해서는 MLOps프로세스가 필수일 것입니다. 본 발표에서는 DevOps에 대한 이야기를 시작으로, R로 구현한 1) 데이터 업로드 2) 머신 러닝 모델 트레이닝 & 배포 3) 시각화 분석 활용 (Shiny) 이라는 3가지 파트가 Azure Machine Learning Service와 GitHub Actions을 통해 MLOps를 데모와 함께 살펴봅니다.
    • slide deck
  • Talk (25min talk, 5min Q&A)
    • Title: The awesome way to buy a good calf with data science.
    • Korean Title: 데이터 과학과 함께 좋은 송아지를 사는 방법
    • Speaker: Youngjun Na (나영준)
    • slide deck

October (10월)



  • Talk (25min talk, 5min Q&A)
    • Title: Weather Report Automation - GitHub Actions
    • Korean Title: “날씨보고서 자동화 - GitHub Actions”
    • Speaker: Kwangchun Lee (이광춘)
    • slide deck
    • Abstract: Automation can a valuable asset for every data scientist. Through newly introduced GitHub Actions many repetitive data science works can be automated such that data scientists can spend more time on problem solvings. Motivated Python weather alerts app, automating weather report has been demonstrated. Meanwhile Xaringan and friends have shown new breakthrough for making slideshows impressive!!!
    • 초록: 자동화는 모든 데이터 과학자에게 정말 중요한 자산이 된다. 새로 소개된 Github Actions을 통해 반복되는 많은 작업을 자동화시킴으로써 본질적인 문제를 해결하는데 더 많은 시간을 쓸 수 있을 것으로 기대된다. 파이썬 날씨 알리미 앱에 영감을 받아 날씨 보고서 자동생성 사례를 시연한다. Xaringan과 친구들로 새로 제작된 발표자료는 감명깊은 발표자료를 제작하는데 큰 영향을 줄 것으로도 기대된다.
  • Talk (25min talk, 5min Q&A)
    • Title: “Tidy하게 그리고 Seamless하게”
    • Korean Title: “Tidy하게 그리고 Seamless하게”
    • Speaker: Choonghyun Ryu (유충현)
    • slide deck
    • 초록: 통계학자에서 비롯된 R 생태계가 이제는 Software Engineer의 합류로 더욱더 풍성해지고 있다. R의 태동과 진화의 역사로부터 tidy하고 seamless한 데이터 분석 아키텍트의 진화에 대해 소개한다. 그리고 이를 응용한 사례에 대한 소개와 tidy하고 seamless한 데이터분석 접근방법에 대해서 논의한다.
  • Talk (25min talk, 5min Q&A)
    • Title: A/B 테스트와 Multi-Armed Bandit
    • Korean Title: A/B Testing & Multi-Armed Bandit
    • Speaker: Sulgi Kim (김설기)
    • slide deck
    • 초록: AI 와 ML 은 과거의 offline / history 데이터만 이용하는 경우가 많지만, 이는 온라인 상에서 비교/확인을 하지 않는다는 점에서 한계가 있다. 이를 극복하기 위해서 A/B 테스트로 대표되는 온라인 테스트와 함께 쓰여야 한다. 한편, multi-armed bandit 이라는 방법은 A/B 테스트보다 유연한 테스트와 실험을 할 수 있게 한다. 이번 발표에서는 multi-armed bandit 을 소개하고, 활용가능성과 새로운 발견들에 대해 논의한다.

November (11월)



  • Talk (25min talk, 5min Q&A)
    • Title: Almost All about Table
    • Korean Title: “표에 대한 거의 모든 것”
    • Speaker: Kwangchun Lee (이광춘)
    • slide deck
    • Abstract: Categorical data is everywhere. We need to understand categorical data with different angles. In this talk, we will see many different aspects of categorical data ranging from table structure to ggplot-style table authoring. Also, all presentation slides are made of xaringan as a bonus.
  • Talk (25min talk, 5min Q&A)
    • Title: “It’s just a magic!!!”
    • Korean Title: “유튜브 데이터의 마술”
    • Speaker: Kevin Na (나성호)
    • slide deck
    • Abstract: 유튜브 크롤링으로 수집한 데이터를 sqlite3로 저장하고 깃허브로 푸쉬할 때마다 자동으로 Shiny 대시보드에서 호출하여 시각화하는 방법을 공유하는 자리입니다. YouTube Crawler + Sqlite DB + Github + RShiny + Crontab = Just Magic!!!
  • Talk (25min talk, 5min Q&A)
    • Title: “Making serverless API with AWS Lambda and API Gateway in an easy way”
    • Korean Title: “AWS Lamba 와 API Gateway로 가볍게 서버리스 API 만들기”
    • Speaker: JungHwan Yun (윤정환)
    • slide deck
    • Abstract: R로 작성된 스크립트를 구동할 수 있는 AWS Lambda 기반 API 서버를 만드는 방법에 대해서 소개합니다. 20분만에 루틴한 전처리 작업을 하거나 가벼운 분석 모형을 서빙할 수 있는 API를 만들 수 있습니다.

December (12월)



  • When: Friday, December 11, 2020 7:00 PM to 9:00 PM GMT+9
    • RSVP opens RSVP opens Friday, November 27, 2020 7:00 PM
  • Where: Online Event - Link visible for attendees
  • Seoul R Users: 2020 - December



  • Talk (25min talk, 5min Q&A)
    • Title: “파워포인트를 넘어서 - xaringan
    • Korean Title: “Beyond Powerpoint - xaringan
    • Speaker: 이광춘(Kwangchun Lee)
    • slide deck
    • Abstract: So far, Microsoft Powerpoint has been a global standard in making slideshows. But due to the commercial software and lack of supporting reproducible data science slideshows, data science community has been looking for open slideshow tools. In response to this challenge, R community introduced the xaringan package several years ago. Like other tidyverse tools, xaringan has been successful in building slideshows ecosystem. Now, it’s a perfect time to make presentation materials with xaringan.
  • Talk (25min talk, 5min Q&A)
    • Title: Data Journalism
    • Korean Title: “데이터 저널리즘”
    • Speaker: 권오성
    • slide deck
    • Abstract: “데이터 폭발의 시대에 저널리즘도 변화하고 있습니다. 데이터 저널리스트로서, 미디어 혁신 담당으로서, 데이터 분석 트레이너로서 활동하고 있는 강연자가 자신의 경험과 동료의 이야기를 바탕으로 데이터 활용 보도의 현재를 짚습니다. 그리고 데이터 분석과 인공지능 기술이 보도 기법으로서 쓰이는 데서 한 발 더 나아가 저널리즘을 혁신하는 데까지 확장되어 쓰여야 하는 이유에 대해 말씀 드립니다.”
  • Talk (25min talk, 5min Q&A)
    • Title: “My experience: Release and maintain CRAN packages”
    • Korean Title:
    • Speaker: 문건웅 (Keon-Woong Moon)
    • slide deck
    • Abstract: 내가 만든 R 코드를 공유하는 가장 좋은 방법은 나의 코드를 R패키지로 만들어 배포하는 것이다. R패키지를 만들 경우 문서화가 된 R코드를 배포할 수 있기 때문에 R을 이용하여 사용자정의 함수를 만들어 사용하는 사용자들이 R패키지를 만들어 본다면 나의 R코드를 이용하여 세상과 소통하는 소중한 경험이 될 것이다. 이는 연구자들이 자기의 연구결과를 논문으로 만들어 발표하는 것과 같다. 논문의 경우 제목과 초록이 중요하듯이 R패키지를 만들어 배포할 때도 패키지의 title과 description이 중요하다. 본 발표자는 2014년 CRAN에 패키지를 등록하면서 경험한 여러 가지 실수들을 여러분들과 공유하고자 한다. 나의 짧은 경험이 CRAN에 패키지를 등록하고자 하는 여러분들에게 조금이나마 도움이 되었으면 한다.

2019

Column

2019-04 ~ 2019-09


Date Name Title Link Comment
2019.09.18(수) 이광춘 “문서를 이해하는 AI” 발표자료
이재화 “케라스를 활용한 RNN & LSTM 자유로운 모델링 방법” 발표자료
나성호 “R로 하는 RPA” 발표자료
윤정환 “이스포츠에서의 데이터 분석” 발표자료
2019.08.21(수) 이광춘 tidyverse 모형 tidymodels 발표자료
한수미/남내현 “사학 학술연구논문 빅데이터 분석-키워드와 토픽모델링 분석을 중심으로” 발표자료
설현수 “jamovi 통계 프로그램 소개” 발표자료
안상선 “위험하지 않은 마약 데이터 흡입 수기 : 마약으로 인한 사회적 비용 모형 추계 사례” 발표자료
2019.07.24(수) 이광춘 “앙상블 모형: R vs. Python” 발표자료
안중호 “마케터를 위한 빅데이터” 발표자료
이현열 “데이터사이언스로 이해하는 퀀트” 발표자료
이민호 “데이터분석가의 가벼운 개발환경 : Ipad로 작업해보기” 발표자료
2019.06.19(수) 이광춘 “데이터 과학자의 글쓰기 - 재현가능한 논문작성” 발표자료
서희 “Reactlog로 Shiny 쉽게 디버깅하기” 발표자료
문건웅 “Conditional Process Analysis using R” 1번, 2번, 3번, 4번
2019.05.15(수) 어수행 “Python에서 EMR데이터 (생존)분석” 발표자료
김지연 “너의 기분 이모지(emoji)? - 감정기반 이모지 추천 시스템” 발표자료
홍원준 “의료데이터 기반의 데이터서비스 개발기” 발표자료
송효진 “Tidyverse Before and After” 발표자료
2019.04.24(수) 이광춘 (한국) 데이터 과학자의 클라우드 서비스 발표자료
정도현 데이터 과학자를 위한 AWS 서비스 소개 발표자료
임상배 Sparklyr을 활용한 R 코드 분산 처리 발표자료
홍운표 Changes and benefits of Automated ML by DataRobot 발표자료

2018-11 ~ 2019-03


Date Name Title Link Comment
2019.03.20(수) 이광춘 금융 빅데이터 시각화 - KOSPI 200 50 발표자료
유제성 운영인력 최적화를 위한 HR Analytics 발표자료, R코드
이승준 S&P500 데이터 수집과 분석 발표01,발표02
안상선 이상하고 비정상적이고 괴랄한 금융 시계열 분석 발표자료
2019.02.20(수) 이광춘 자연어 처리는 R로 가능한가? 발표자료
나성호 카카오 지도 API 핸즈온 발표자료
어수행 Self-supervised learning for surgical vision data 발표자료
2019.01.23(수) 김설기 R for Data Science 발표자료
나영준 R for animal science: project adatalab 슬라이드쉐어, GitHub
김준혁 RcppMeCab은 왜 만들었나? 발표자료
차석근 스마트공장 및 데이터 분석 발표자료
2018.12.20(목) 이광춘 데이터 과학자가 바라본 사기 탐지(Fraud Detection) 발표자료
나성호 2018 프로야구 기사로 살펴본 이모저모 발표자료
최진영 AutoML과 머신러닝 툴 개발/사업화 과정의 어려움 발표자료
2018.11.22(목) 이광춘 설명가능한 기계학습 발표자료 클라우데라
나성호 기업리뷰 분석 시리즈 1 2 3 순천향대학교

2018

Column

2017-08 ~ 2018-02


Date Title Name Link Comment
2017.08.23(수) 감성분석(Sentiment Analysis) - 깔끔한 텍스트 방식(tidytext) 이광춘 발표자료
modelr 이상열 발표자료
2017.09.20(수) 쉽게 배우는 R 데이터분석 김영우 발표자료
재현가능한 연구를 위한 데이터 과학 제품 개발 이광춘 발표자료
한글 텍스트데이터 분석 류충현 발표자료
2017.10.18(수) R 로 웹 데이터를 가져오는 4가지 방법(은 크롤링) 박찬엽 발표자료
데이터과학 블로그 10분 완성 이광춘 발표자료
테드(TED) 에듀데이터 분석 한수미 발표자료
Shiny의 기본 원리와 이해 김승욱 발표자료
2017.11.15(수) 통계모형 시각화 이광춘 발표자료
R언어 역사 이광춘 발표자료
catboost 소개 이상열 발표자료
2017.12.21(목) LASSO regresion을 이용한 Taxonomy 류충현 발표자료
메타분석(Meta analysis) 김가경 발표자료
시계열 데이터 예측 이광춘 발표자료
2018.01.17(수) h2o 소개 황문기 발표자료
Spark R 소개 지용기 발표자료
Code Snippets: batch jobs in R(라이트닝 토크) 어수행 발표자료
Code Snippets:R 암호화폐 이광춘 발표자료
2018.02.21(수) 빅데이터는 디스크에 쓰고 R 메모리라고 읽는다 이광춘 발표자료
한국 영화배우 데이터로 만든 한국판 케빈 베이컨 놀이 나성호 발표자료
데이터 정규화를 통한 Feature Selection 장윤경 발표자료 부존재

2018-03 ~ 2018-05


Date Title Name Link Comment
2018.03.21(수) R과 shiny를 이용한 web application 제작 문건웅 발표자료
Shiny Drill Down 이희재 발표자료
Rstudio 컨퍼런스 후기 양승훈 발표자료
2018.04.25(수) 언론사 데이터 저널리즘 배여운 비공개
데이터는 알고있다 김영우 발표자료
백 마디 말보다 그래프 하나 - ggplot 이광춘 발표자료
라이트닝 토크 - 에너지 데이터 분석 김설기 발표자료
라이트닝 토크 - 뉴스기사 솔루션 (키워드, 문장요약, 분류기) 소개 황문기 발표자료
2018.05.23(수) R 패키지: 신규 패키지 소개 - dlookr 류충현 발표자료
CRAN으로 거쳐가는 정거장 - Github suggetR 패키지 이광춘 발표자료

History

Column

R Meetup Season II

R Meetup을 시작점으로 출발을 했지만, Meetup에 오시는 분들은 대부분 데이터 사이언스 문제를 풀려고 하는 학생이나 실무에 계신 분들이 많아 이에 부합되도록 Meetup 운영을 변경하게 되었습니다.

Tidyverse KoreaPRESSer 공동으로 R Meetup 시즌2를 2018년 11월부터 시작했습니다. 2019년부터 “데이터 사이언스” Meetup으로 출발하게 되는 이유는 크게 두 가지입니다. 먼저 R 언어로 코딩하면서 발표하시는 분을 연사로 모시는 것이 어려웠습니다. R Meetup 시즌1부터 같은 연사분이 계속 발표를 진행함으로써 피로감이 깊어지는 것이 “데이터 사이언스 밋업”으로 확대하게된 직접적인 이유입니다. 다른 한편으로는 R Meetup에 오시는 분들이 R보다는 “데이터 사이언스” 문제를 갖고 계신 분이 많다는 것이 그동안 밋업을 운영하면서 알게 되었습니다. “데이터 사이언스”에 대한 저변이 확대되어 사회적인 호응도 있는 것으로 판단되고, 특히 reticulate, keras, sparklyr 등 다양한 R 팩키지가 출현하면서 더 이상 R, 파이썬 등 언어중심으로 Meetup을 나눠 진행하는 것은 무의미해졌기 때문입니다.

데이터 분석가와 과학자들이 만나 피자와 가벼운 맥주를 마시면서 세미나 듣는 방식으로 진행되었고, R 뿐만 아니라 파이썬을 비롯한 데이터 사이언스 하시는 분들이 모이는 미트업이였습니다.

R Meetup Season I

xwMOOC R Meetup은 KRUG 1,2대 회장을 역임한 유충현님을 모시고 xwMOOC 이광춘, 캐글뽀개기 이상열이 십시일반 노력을 하여 2017년 8월 ~ 2018년 5월까지 매월 총 10회 진행되었습니다. KossLab(공개SW 개발자센터)의 공간지원을 받아 나름 쾌적한 환경에서 R 사용자들이 모여 즐거운 배움과 네트워킹 시간을 갖게되었습니다.

  • 주관 : xwMOOC
  • 운영 : 캐글뽀개기
  • 장소 : 토즈 강남점 / 선릉 패스트파이브
  • 매달 셋째주 수요일

Code of Conduct

행동 강령 (Code of Conduct):


네트워킹과 협업 그리고 학습을 위해서 공동체 행사의 일환으로 서울 R 미트업이 기획되었다. 과학 공동체에 속한 모든 구성원의 참여를 중시하고, 참석자 모두가 즐겁고 성취감을 얻어갔으면 합니다. 따라서, 모든 참여자는 워크샵 동안에 다른 참석자에 대한 존경과 예의를 보여주셔야 합니다.


좀더 명확히 하기 위해서, 서울 R 미트업와 토론에 참여한 모든 사람 - 강사, 조교, 학습자, 주최자 - 은 다음 행동 강령(code of conduct)을 지켜야 합니다. 미트업 주최측에서는 행사동안에 행동 강령을 적용해야 합니다.


성별, 동성애, 장애, 외모, 신체 크기, 인종, 국적, 종교 혹은 텍스트 편집기 선택에 관계없이, 괴롭힘 없는 학습 경험을 제공하는데 최선을 다하고 있습니다. 어떤 형태로 참가자를 괴롭히거나 희롱하는 것을 용납하지 않을 것입니다.


괴롭힘과 희롱에는 성별, 동성애, 장애, 외모, 신체 크기, 인종, 국적, 종교와 관계된 공격적인 언급 및 공공 장소에서 성적 이미지, 고의적인 위협, 스토킹, 희롱하는 사진이나 녹음, 지속적인 대화나 행사 중단, 부적절한 신체 접촉, 불쾌한 성적 관심도 포함합니다. 다양한 배경의 사람들을 포함하는 전문 참가자에게 모든 의사소통이 적절해야 한다. 성적 언어와 이미지는 어떤 경우에도 적절하지 않습니다. 다른 사람들에게 친절해야 합니다. 다른 참석자를 모욕하거나 폄하하지 마세요. 전문가 프로처럼 행동하세요. 성희롱과 성차별, 인종차별, 배제하는 농담은 적절하지 않습니다. 괴롭히거나 희롱하는 행동을 멈추도록 주의받은 참여자는 즉시 행동강령을 준수해야 합니다. 이러한 규칙을 위반한 참가자는 돌려받을 수도 있는 학습비의 환불없이 주최측의 재량에 따라 행사를 떠나도록 요청받을 수도 있습니다.


모든 사람을 위해서 따뜻하고 친목을 도모할 수 있는 미트업을 만들수 있도록 도와주셔서 감사합니다.

 

Data Scientist Kwangchun Lee

kwangchun.lee.7@gmail.com