티스토리 뷰

기사

study

chargehye 2022. 7. 26. 08:58

## 개인정보 비식별화 조치방법에는 총 5가지가 있다. 가명처리, 총계처리, 데이터삭제, 데이터범주화, 데이터마스킹 

  • 가명처리는 주요식별 요소를 다른값으로 대체하는 방법이다. 하지만 값을 대체 시 규칙이 노출되어 역으로 쉽게 식별할 수 없도록 주의
  • 총계처리는 데이터의 총합 값을 보여주고 개별값을 보여주지 않는 방법
  • 데이터삭제는 데이터 공유나 개방 목적에 따라 데이터 셋에 구성된 값 중 필요없는 값 
  • 데이터범주화는 데이터를 범주의 값으로 변환하여 숨기는 방법
  • 데이터마스킹 : 개인을 식별하는 데 기여할 확률이 높은 주요 식별자를 보이지 않도록 처리,

### ETL( Extract, Transform, Load) : 원천데이터로부터 필요한 데이터를 추출하여 적재하고자 하는 데이터 웨어하우스에 맞게 변환하여 적재하는 과정

### 빅데이터플랫폼의 빅데이터 수집기술 : 크롤링(Crawling), 로그수집기, 센서 네트워크, RSS Reader/Open APO, ETL

### 맵리듀스의 데이터 처리과정 split -> Map -> Shuffle -> Reduce

## 부하제어기능 컴퓨팅부하제어, 저장부하제어, 네트워크부하제어

### 딥러닝분석기법 :CNN(Convolutional Neural Networks, 딥러닝에서 주로 이미지나 영상데이터 처리에 쓰임), RNN(Recurrent Neural Network), LSTM(Log Short-Term Memory), Auto-encoder......  // KNN(K Nearest Neighborhood, 머신러닝 알고리즘)

### 애노테이션(Annotation) : 데이터상의 주석작업으로 딥러닝과 같은 학습 알고리즘이 무엇을 학습해야 하는지 알려주는 표식 작업

 

'기사' 카테고리의 다른 글

1  (0) 2022.09.23
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
TAG
more
«   2025/06   »
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30
글 보관함