연구실소개

김용대. 지능형 자료분석 연구실 http://stat.snu.ac.kr/idea/

소개
불확실한 현상들에 대하여 질서와 법칙을 발견하고 연구한다. 현대 통계학의 대표적인 이론분야인 경험과정(Empirical Process)을 기본으로 다양한 응용분야에 대한 이론과 방법론을 개발한다. 특히 대용량 자료의 패턴과 관계를 분석하는 데이터마이닝(Data Mining), 개체의 수명과 원인 등을 분석하는 생존분석(Survival Analysis), 베이지안 방법론(Bayesian Statistics) 등을 연구한다.
관심분야
Statistical Learning and Data Mining
High-dimensional Data Analysis
Survival Analysis
Bayesian Statistics

박병욱. 비모수추론 연구실 http://stat.snu.ac.kr/theostat/

소개
자료의 양이 방대해지고 복잡도가 증가함에 따라 유한차원(finite dimension) 모수공간(parameter space)을 가정하는 모수적 방법(parametric methods)의 경우, 통계적 추론의 융통성(flexibility)을 기대하기 어렵다. 이를 극복하기 위해 모수공간을 무한차원(infinite dimension)으로 확장하는 통계적 방법론이 요구되며, 확장된 공간에서 추론의 융통성을 보장하는 모형과 효율적(efficient) 추정 방법에 대한 연구가 필수적 이다. 본 연구실에서는 비모수적 방법(nonparametric methods)과 준모수적 방법(semi-parametric methods)을 통해 무한차원 모수공간에서의 통계적 모형과 그에 따른 점근이론(asymptotic theory)을 연구한다. 특히 가법모형(additive models)과 같은 비모수구조모형(nonparametric structured models)에 기반하여 부분선형회귀(partially linear regression), 가변계수회귀(varying coefficient regression), 분위수회귀(quantile regression) 등 다양한 통계모형들을 연구하고 있다. 나아가 비모수모형에서 고차원 빈측(HDLSS, high-dimensional low sample size) 자료에 적용 가능한 통계적 분석 방법론 개발을 목표로 하고 있다.
관심분야
Nonparametric and Semi-parametric Estimation
High-dimensional Low Sample Size Problem
Functional Data Analysis

박태성. 생물통계 연구실 http://bibs.snu.ac.kr

소개
생물정보통계(BioInformatics & BioStatistics, BIBS) 연구실은 국내의 생물통계학과 생물정보학 분야의 연구를 선도하고 있으며 2005년에 통계학 분야 최초로 NRL(National Research Laboratory)로 선정되어 5년간 유전체, 전사체 연구를 이끌어왔다. 최근에는 NRL을 통해 축척한 연구 결과를 바탕으로 통계학 분야 최초로 2012년에 창의연구단으로 선정되어 최장 9년간 장기간 동안 대규모의 고차원 생물정보학 자료의 분석을 위한 연구에 집중할 수 있는 기반이 마련되었다. 생물정보통계연구실은 다양한 종류의 대규모 임상자료와 생물학 자료를 분석하기위해 통계학에 기반한 연구방법론의 개발 및 응용에 초점을 맞춘 연구를 진행하고 있으며 통계학에 기반한 생물정보학 연구를 수행하고 있다. 특히 최근의 새로운 유전체 기술의 발달로 인해 대용량의 유전체데이터가 낮은 가격으로 생산되면서, 개인수준에서도 유전정보를 뽑아낼 수 있는 시대가 도래하였다. 따라서 다양하고 방대한 자료들 중 의미 있는 정보를 효율적으로 찾아내기 위해 통계학의 필요성이 더 절실해졌다. 또한 통계학의 여러 가지 방법들이 이러한 대규모 오믹스 자료의 분석에 응용됨으로써, 질병 연구에 큰 기여를 하고 있다. 생물정보통계연구실에서는 마이크로어레이 기술을 이용한 유전자 발현이나 단일염기다형성(SNP)과 같은 유전체 자료뿐 아니라, 최근 개발된 차세대염기서열해독(NGS) 기술을 통한 유전체 및, 후성유전체 자료 등 다양한 종류의 오믹스 자료를 통합하여 분석하기위한 통계학 기반의 분석 방법 및 기술을 연구하고 있다. 더 나아가서 유전자간의 복잡한 상호작용탐지 및 여러 수준의 오믹스 자료를 통합 분석할 수 있는 방법을 개발하여, 생물학적 현상의 보다 깊은 이해를 도모하고 질병이 일어나는 원인 및 기작 등을 밝혀내어 인류복지증진에 기여하는 것이 목표이다.
관심분야
Repeated Measures data analysis
Missing data analysis
Microarray data analysis
Statistical Genetics
Gene-Gene interaction model
Integrated Omics Data analysis

오희석. 통계적 다중척도 분석 연구실 https://sites.google.com/view/snumultiscale/

소개
자연과학, 공학을 포함한 다양한 분야에서 관측되는 많은 자료나 현상들은 구조가 복잡하여 하나의 관점(척도, singlescale)으로 그 복잡성을 이해하기 쉽지 않다. 이와 같은 복잡자료(complex data)를 다중척도(multiscale)로 표현한다면 보다 효과적으로 자료의 구조 및 특성을 이해하고 정리할 수 있다. 본 연구실에서는 통계모형화와 추론에 다중척도방법을 접목하여 통계이론과 방법론 및 응용의 확장을 목표로 한다. 구체적인 연구분야는 통계학과 다중척도방법(multiscale methods in statistics), 함수추정(functionestimation), 시계열분석(time series analysis) 등이다.
관심분야
Multiscale methods in statistics
Spatial-temporal data analysis
Statistical methods for climatology

원중호. 통계계산 연구실

소개
본 연구실은 공학, 금융, 의료 분야에서 나타나는 고처리량 (high-throughput) 자료의 통계적 상호작용 패턴을 찾아내는 계산적 방법론을 주로 연구한다. 특히 대용량 데이터 분석을 위한 고성능 컴퓨팅 (high-performance computing; HPC) 기법을 적극적으로 통계 계산 문제에 적용하고자 한다.
관심분야
High-performance computing for large-scale statistical computation
Modeling and computational optimization methods in statistical datamining, bioinformatics, and image processing
Statistical inference on large-scale data

이상열. 시계열 예측분석 연구실 http://stat.snu.ac.kr/tspa/

소개
본 연구실에서는 재정시계열분석 (financial time series analysis), 위험관리 (risk management), 모형의 변화점 탐지 (change point analysis) 및 통계적 공정관리 (statistical process control), 환경보건통계학 (environmental and healthcare statistics), 예측분석방법론 (predictive analytics) 및 사회과학 자료 분석 (social science statistics) 등을 주로 연구하고 있다. 또한 모형의 적합도 검정 (goodness of fit test), 극단값 이론 (extreme value theory) 등도 주요한 연구 분야중 하나이다. 최근에는 support vector machine 및 deep learning 알고리즘을 기존의 시계열 모형과 결합하는 hybrid method의 개발을 중점적으로 시도하고 있다.
관심분야
Financial time series analysis and risk management
Change point analysis and statistical process control
Environmental and healthcare statistics
Social science data and SNS analysis
Predictive analytics and machine learning

이영조. 다단계 일반화 선형모형 연구실 http://stat.snu.ac.kr/hglmlab/

소개
통계학에서 다루어지는 자료의 특성들이 점점 복잡해짐에 따라 이를 분석하게 되는 모형 또한 복잡하게 된다. HGLMs은 extended likelihood를 바탕으로 longitudinal data, time series data, spatial data, missing data, censoring data 등을 분석하는 통계적 방법론에 해당한다. Pawitan(2001)은 그의 저서에서 extended likelihood의 정당성을 밝힘으로써, 다단계 일반화 선형모형(HGLMs)의 이론적인 근거를 제시하였다. 본 연구는 공간적(spatial), 시간적(temporal) 특성을 갖는 자료 분석 및 환경, 의료, 공학분야 등에서 생성되는 복잡계 자료들에 응용될 수 있는 방법이다.
관심분야
HGLMs
missing data analysis
financial time series analysis
measurement error model
multivaraite survival analysis
extension of likelihood method

이재용. 베이지안 통계학 연구실 https://snubayes.wordpress.com/

소개
본 연구실에서는 베이지안 통계학의 이론과 계산 그리고 베이지안 통계학을 이용한 다양한 응용문제에 대해 연구한다. 구체적으로는 비모수 베이지안 모형, 고차원 통계 모형, 몬테카를로 계산, 기상학, 생물학, 의학에서의 베이지안 방법 등을 연구한다.
관심분야
Bayesian nonparametric models
High-dimensional statistical models
Bayesian asymptotics
Monte Carlo methods
Bayesian statistical methods in climatology, biology and medical science

임요한. 다변량 통계 연구실 https://sites.google.com/view/mvstat

소개
본 연구실은 복잡한 확률 구조를 지닌 다차원 (또는 고차원) 자료에 대한 이론과 방법론을 연구한다. 특히 고차원 공분산 행렬의 이론, 확률적 그래프 모형과 잠재 변수 모형에 대한 방법론, 그리고 순서관련 통계 절차를 연구하고 이를 통하여 여러 응용분야의 문제들에 대한 통계적 기법을 제공한다.
관심분야
(Large scale) multivariate statistical procedure
Order related statistical inference
Latent variable models
Statistical computing

임채영. 공간 통계 연구실 http://stat.snu.ac.kr/spatstat/

소개
본 연구실에서는 공간 통계학의 이론 그리고 공간 통계학 방법론을 이용한 다양한 공간 또는 시공간 자료를 다루는 응용문제에 대해 연구한다. 구체적으로는 공중보건, 의생물공학, 생체인식, 로보틱스등 다양한 분야에서 획득되는 공간 또는 시공간자료를 분석하기 위한 공간통계학방법론과 그 이론적 토대를 연구한다.
관심분야
Bayesian nonparametric models
High-dimensional statistical models
Bayesian asymptotics
Monte Carlo methods
Bayesian statistical methods in climatology, biology and medical science

장원철. 고차원 대용량 자료분석 연구실

소개
본 연구실은 천문학, 뇌인지과학, 생물정보학분야에 혼히 볼 수 있는 고차원 대용량 자료의 분석과 그에 필요한 새로운 통계적 방법론에 대해 연구한다. 이러한 방법론들의 예를 들자면 우주거대 구조 (large structure of the universe)를 이해하기 위해서는 은하 군집(galaxy clusters)의 분포에 관한 추론, fMRI분석에서 사용되는 고차원 자료를 위한 다중검정방법등을 들 수 있다. 또한 고차원 모형에 분석에 있어서 중요한 이론적 토대를 제공하는 shrinkage estimator을 관한 연구와 이를 이용한 새로운 통계적 모형에 관한 연구한다.
관심분야
Large-scale Inference
Multiple Testing
Social Network Analysis
Statistical Applications in Astronomy and Neuroscience

정성규. 통계적학습이론 연구실

소개
본 연구실은 고차원다변량자료와 기하적 자료의 통계분석을 위한 이론과 방법론을 연구한다. 고차원 저표본 자료를 스파이크 모형과 희박성 가정 하에서 차원 축소, 분류하는 방법 등을 개발하며, 특히 고차원 자료의 기하적 성질을 이용한 방법론의 개발과 이론적, 실증적 분석을 도모한다. 또한, 방향, 형상 등의 매니폴드 값을 가지는 자료가 비유클리드 공간에 있음을 감안하여, 그 자료에 적합한 효율적인 통계 모형 개발과 그 추정, 추론법을 연구하며 기계학습 (또는 statistical learning)을 비유클리드 자료분석에 응용한다. 의생명공학, 뇌과학, 유전학, 컴퓨터 비전 및 의료영상분석 등에서 고차원다변량자료와 특수한 구조를 가진 비유클리드 자료가 많이 나타나므로, 관련분야에 쓰일 수 있는 통계기법을 제시한다.
관심분야
High-dimension, low-sample-size problems
Analysis of structured, geometric and non-Euclidean data
Statistical learning

Myunghee Cho Paik. 생물통계 연구실

소개
본 연구실은 의학 보건 연구에서 일어나는 통계문제들을 연구한다. 특별히 longitudinal data, clustered data, incomplete data, missing data와 estimating equations에 관한 이론과 방법들에 대해 연구한다.
관심분야
Biostatistics
Longitudinal data analysis
Missing data
Estimating equations

Junyong Park. 고차원 다중검정 연구실

소개
본연구실은 고차원에서의 통계적 가설검정 및 추론, 다중 검정, 고차원 분류 문제 및 메타 분석을 다루며 그에 대한 방법론의 개발과 이론적 규명을 연구한다. 이러한 방법들을 기반으로 유전정보학 및 의료분야에 응용하는 것을 연구한다.
관심분야
Hypothesis testing in high dimension
Multiple testing
Classification in high dimension
Bioinformatics
Meta Analysis