지식노동자의 노트

SAS 중복데이타 제거 및 추출 본문

SAS

SAS 중복데이타 제거 및 추출

생각하는너구리 2012. 5. 8. 15:18
728x90

중복데이타를 삭제하는 것은 다들 아실테고, 중복인 넘들을 하나만

남기고 나머지를 뽑아서 따로 셋을 만드는 방법입니다.

Proc sort dupout 옵션을 사용하시면 됩니다.

 

data dupyes;

             input a b c;

datalines;

1 3 5

1 3 5

1 3 5

2 4 5

2 4 5

1 2 3

3 2 1

;

run;

 

proc sort data=dupyes out=dupno dupout=dupdup noduprec;

by _all_;

run;


dupno 셋에는 중복이 제거된 관측치, dupdup셋에는 중복인 관측치만 모여 있습니다.

by _all_ 이니까 전체 변수를 모두 비교하는 겁니다.

반응형
Comments