티스토리 뷰
## 개인정보 비식별화 조치방법에는 총 5가지가 있다. 가명처리, 총계처리, 데이터삭제, 데이터범주화, 데이터마스킹
- 가명처리는 주요식별 요소를 다른값으로 대체하는 방법이다. 하지만 값을 대체 시 규칙이 노출되어 역으로 쉽게 식별할 수 없도록 주의
- 총계처리는 데이터의 총합 값을 보여주고 개별값을 보여주지 않는 방법
- 데이터삭제는 데이터 공유나 개방 목적에 따라 데이터 셋에 구성된 값 중 필요없는 값
- 데이터범주화는 데이터를 범주의 값으로 변환하여 숨기는 방법
- 데이터마스킹 : 개인을 식별하는 데 기여할 확률이 높은 주요 식별자를 보이지 않도록 처리,
### ETL( Extract, Transform, Load) : 원천데이터로부터 필요한 데이터를 추출하여 적재하고자 하는 데이터 웨어하우스에 맞게 변환하여 적재하는 과정
### 빅데이터플랫폼의 빅데이터 수집기술 : 크롤링(Crawling), 로그수집기, 센서 네트워크, RSS Reader/Open APO, ETL
### 맵리듀스의 데이터 처리과정 split -> Map -> Shuffle -> Reduce
## 부하제어기능 컴퓨팅부하제어, 저장부하제어, 네트워크부하제어
### 딥러닝분석기법 :CNN(Convolutional Neural Networks, 딥러닝에서 주로 이미지나 영상데이터 처리에 쓰임), RNN(Recurrent Neural Network), LSTM(Log Short-Term Memory), Auto-encoder...... // KNN(K Nearest Neighborhood, 머신러닝 알고리즘)
### 애노테이션(Annotation) : 데이터상의 주석작업으로 딥러닝과 같은 학습 알고리즘이 무엇을 학습해야 하는지 알려주는 표식 작업