목록머신러닝 (6)
Data Analysis for Investment & Control
클러스터링 기법 중에 대표되는 것으로 다차원 입력 데이터를 어떻게 어떤 그룹에 속하게 할지에 대한 문제를 다룬다. 데이터의 집합을 정의하자. N개로 이루어져 있는 데이터를 K개의 클러스터로 분류하려고 한다(물론 K는 미리 지정한다). K개의 클러스터 정 중앙에 놓여 있는 값을 μk라고 표기 한다. K-means 클러스터링의 아이디어는 K개의 mean(중앙 값)을 이용해 클러스터링 하는 것이다. μk와 이에 속하는 클러스터 데이터 사이의 거리의 총합은 클러스터에 속하지 않는 데이터 사이의 거리의 총합보다 작다. 그러므로 우리의 목표는 주어진 데이터 집합으로부터 이러한 중심 μk의 값을 결정하는 것이다. N개의 데이터를 K개의 클러스터로 구분지어 Sk = {S1, S2, ... SK}의 데이터 집합으로 구분..
1. Classifications - SVM- Bagged Decision Trees- K-nearest neighbor- Naïve Bayes- Discriminant Models- CNN - RNN & LSTM 2. Regressions - Linear Regression- Nonlinear Regression- Stepwise Regression- Regularization- Adaptive neuro-fuzzy 3. Clustering - K-means clustering- Hierarchical clustering- Gaussian Mixture Model- Hidden Markov Models- Self-organizing Map- Fuzzy C-means clustering- Subtract..
현대 딥러닝 분야에서 가장 포션이 큰 분야 중 하나라면 CNN을 들 수 있다. 하드웨어 성능이 발전하면서 단위 연산 당 가격이 엄청나게 저렴해 졌기 때문에 전에는 컴퓨팅 성능이 따라주지 못해서 구현할 수 없었던 알고리즘들이 ImageNet 대회와 같은 대회를 통해 세상에 알려지면서 많은 기술적 진보를 이루어 내고 있다. 이미 CNN에 관한 많은 학습자료들이 웹에 존재하기 때문에 여기서는 굳이 상세한 설명은 하지 않으며, 회사에서 자체 세미나 과정을 거치면서 개인적으로 추천할만한 과정이나 블로그 또는 논문 등을 정리하려한다. CNN에 대해서 다는 아니지만 공부를 해본 결과, 동물이나 사람의 시신경 및 뇌를 통해 입력된 시각적 시그널에 대한 반응과 이를 기반으로한 분류(인지)하는 과정을 모델링 하는 것이라고..
안녕하세요. 오랜만에 업데이트 안내를 하게 되었습니다. 작년 한해 서비스 웹사이트에 대한 관리를 제대로 하지 못했습니다. 개인적인 이유도 있었고, 전반적인 개선이 필요하다 싶어서 데이터 분석을 위한 기반 인프라 툴을 개발 필요성 때문이기도 했습니다. 기존 버전에서 제공하던 기업 적정가치 분석은 CASE라는 이름으로 서비스 되고 있으며, 섹션 구분을 통해 좀 더 보기 편하게 구성하였습니다. SIRE라는 이름의 스크리닝 서비스는 기본적으로 지표 범위를 정해 놓고 스크리닝하는 방법과 마법공식을 이용한 스크리닝 기법 등을 제공합니다. MACRO는 거시 경제 지표의 간단한 분석을 위한 서비스입니다. 모바일에서보다는 PC 환경에서 더 최적화 되었으며, 분석 내용의 가독성을 위해 PC 환경에서 이용하시기를 권장합니다..
가깝게 다가온 미래 기술 중 하나인 자율주행 강국 미국에서는 자율 주행의 성숙도를 나타내는 단계를 대략적으로 구분해 놓고 있다. 미국 도로교통 안전국(NHTSA)에서 정한 레벨 0~4까지 5단계로 구분되는 것이 그것인데, 어느 정도의 성능으로 구분되는지 살펴 보도록 하자. 아래의 그림을 참고하자. 이미지 출처 : 구글링 NHTSA에서 공개한 자료에 따르면 각 레벨별 자동화 성능은 다음과 같다. No-Automation (Level 0): The driver is in complete and sole control of the primary vehicle controls – brake, steering, throttle, and motive power – at all times. 운전자는 자동차를 제어하기..
유전 알고리즘을 가지고 어떤 응용을 할 수가 있을까? 유전 알고리즘의 강점 중에 하나는 전역적 최적해를 찾는데 있다. 그것은 어떤 대상을 모델링하는데 있어서 함수 관계로 설명하고자 할때 함수의 인자를 구해야 하는데, 다른 방법으로는 이 인자를 구하기가 쉽지는 않다. System Identification을 사용하여 모델링을 할 수도 있고, Gradient Decent 방법을 가지고 해를 찾을 수 있지만, 지역 국소해(Local Minima) 문제에 빠질 가능성이 있다. 개인적인 관심사인 금융공학, 특히 주가 예측과 관련하여 유전 알고리즘이 사용된 예가 있는지 구글링해 보았다. 그 결과 몇 편의 논문을 찾을 수가 있었는데, 그 중 한 편 선택해 적용된 아이디어를 검토해 보았다. 검토 논문 선정 Expert..