일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- 데이타마이닝 툴
- SAS 연산오류
- R 프로그래밍
- subset
- 리더쉽
- 스틱pc
- 강의자료
- 베트남 #자동차 #베트남자동차보급율
- Deepfake
- SAS에서 한글사용
- SAS 날짜
- FPT #베트남기업
- 지방자치단체조합
- 딥페이크
- 책모음
- 일본 뜀틀 응원 기적 감동
- HDMI-DVI
- 뉴스로 이해하는 베트남
- 웨카
- hdmi젠더
- 티스토리챌린지
- SAS
- 기계학습
- 얼굴합성앱추천
- 베트남삼겹살
- 오블완
- SAS 계산오류
- 사례기반추론
- 토드부크홀츠
- r
- Today
- Total
목록분류 전체보기 (112)
지식노동자의 노트
권장할 만한 일도 아니고 자주 쓰는 일은 아닙니다만 가끔 변수명을 한글로 지정할 일이 있습니다. 보통 변수명은 영문으로 해야 하고 꼭 한글을 써서 식별을 쉽게 하고 싶다면 라벨에 한글을 씁니다. 하지만 Proc Export 를 사용해서 Excel에 내보내기를 하는 경우에는 라벨명으로 내보낼 수가 없어서 불편할 수가 있죠. 이럴 때는 시스템 옵션 중에서 validvarname = any 를 사용합니다. 1. 시스템 옵션사용해서 한글변수명 사용하기 예제 데이타셋을 생성하는 것으로 시작 해 보겠습니다. 아래와 같이 입력하시 실행하시면 됩니다. options validvarname = any; data var_Korean; input var1 var2 한글변수1 한글변수2; label var1 = "영어변수1"..
SAS의 연산 오류, 그것도 더하기 빼기를 틀린다면 믿으시겠습니까? 이번에는 좀 근본적인 문제를 짚고 넘어 가겠습니다. 꼭 SAS에만 국한된 문제는 아니지만 어쨌든 SAS를 사용하시면서 간단한 사칙연산을 많이 해 오셨을걸로 믿습니다. 그런데 SAS가 산수를 제대로 못하는 경우를 보신적 있으신가요? 무슨소리냐구요? 맞습니다. SAS가 계산을 틀릴(?) 수 있다는 얘깁니다. 그럼 이걸 어떻게 믿고 쓰냐구요? 원인을 알고 같은 문제가 발생하지 않도록 조치해야겠죠. 예를 들어 문제를 풀어 보겠습니다. data strange; a = 0.3; b = 3 * 0.1; if 0 = a - b then c = "a와b는 같다"; else c = "a와b는 다름"; run; a에는 0.3 , b에도 0.3이 들어가 있는..
이번에는 SAS의 중복 관측치에 대한 얘기를 해 보려고 합니다. 중복은 크게 2가지로 나눠 볼 수 있겠습니다. 특정 칼럼값 한 개 또는 여러 개가 같은 경우와 모든 칼럼값이 같은, 즉 관측치 또는 레코드의 중복으로 구분해 볼 수 있겠죠. 하지만 레코드의 중복이란 결국 칼럼값 중복의 확장형태로 이해하시면 될 것 같습니다. 위 그림1을 잘 관찰해 보시죠 학번 칼럼에는 971215라는 값이 무수히 중복되어 있습니다. 이름에는 '김초롱', '김사랑' 이 중복되어 있네요. 두 사람은 학번이 같은걸로 보아 개명을 한 것 같습니다. 주거지 정보를 보면 김말순은 서울에서 2012년5월8일까지 최종 거주하여 기록이 하나 뿐이고 김초롱은 부산에서 서울로, 서울에서 대전으로 이사를 다닌 것 같습니다. 그리고 최종적으로 대전..
최근에 개인정보보호에 관한 법률이 개정되면서 한 동안 '정보보호'라는 키워드가 관심을 받았습니다. 현대캐피탈에서는 해킹으로 인해 대량의 고객정보가 유출되면서 언론의 집중조명을 받았었죠. 그 때 충격이 컸던 탓인지 이 회사는 최근 발간한 업무지침서의 첫 챕터를 이렇게 만들었습니다. 고객정보는 목숨만큼 소중하다! 고객정보는 우리가 가장 소중하게 지켜야 할 대상입니다. 그 어떤 상황에서도 타협니다 예외는 있을 수 없습니다....(중략)''' 고객정보와 관련된 기본 규정과 세부 지침을 숙지해야 합니다.(후략)...그리고 그 실천 세부 지침이란 다음과 같습니다.고객정보를 지키는 기본 원칙1. 최소수집의 원칙2. 목적 내 활용의 원칙3. 적시 파기의 원칙4. 내부관리의 원칙과연 우리나라 경영환경에서 이 지침들이 잘..
내가 자취생활을 하던 시절, 사람들이 내 방에 오면 빠지지 않고 하는 말이 있는데 바로 책이 많다는 얘기다. 얼마전에 박원순 시장의 서가를 봤는데 거기에 비할바는 전혀 아닌것 같고, 다만 요즘 젊은 세대는 책을 안읽는다고들 하니 상대적으로 많다는 얘기로 들린다. 스스로를 판단해 보면 나름 나는 책을 좋아하고 많이 읽는 편이며 직접 사서 보는 것을 절대적으로 선호한다. 또 어디선가 좋은 책을 읽었다면 이미 읽은 책이어도 소장용으로 기어이 한 권을 구매하기도 한다. 그러나 그 동안 책을 읽으면서 늘 떠나지 않는 질문이 있으니 "과연 나는 책을 제대로 읽고 있는 건가?", "책은 어떻게 읽어야 하는 건가?" 라는 아주 기초적인, 중학교 국어교과서에서나 나올것 같은 질문이다. 사실 읽고 나서 내용이 잘 생각이 ..
매일 아침 SAS 프로그램을 실행시켜서 그 산출물로 보고서를 만들고 계신 실무자라면 귀가 번쩍 뜨이실지도 모르겠습니다. 특히나 그 보고서 때문에 정해진 출근시간보다 항상 먼저 출근해야 하는 신참이시라면 말이죠. 매일 정해진 시간에 SAS가 자동 실행되어 Output 이 나와 있다면 편하겠죠? 다음과 같이 따라 해 보시기 바랍니다. 1. Batch파일 만들기notepad와 같은 text파일 편집기를 열고 아래와 같이 타이핑 한다 (sas.exe 파일의 경로, 실행하고자 하는 SAS프로그램이 저장된 경로에 주의, SAS파일명은 반드시 영어로 하세요) "C:\Program Files\SAS\SAS 9.1\sas.exe" -sysin C:\test\bat_test.sas1. bat_test.sas = 보고서작성..
중복데이타를 삭제하는 것은 다들 아실테고, 중복인 넘들을 하나만 남기고 나머지를 뽑아서 따로 셋을 만드는 방법입니다. Proc sort 에 dupout 옵션을 사용하시면 됩니다. data dupyes; input a b c; datalines; 1 3 5 1 3 5 1 3 5 2 4 5 2 4 5 1 2 3 3 2 1 ; run; proc sort data=dupyes out=dupno dupout=dupdup noduprec; by _all_; run; dupno 셋에는 중복이 제거된 관측치, dupdup셋에는 중복인 관측치만 모여 있습니다.by _all_ 이니까 전체 변수를 모두 비교하는 겁니다.
초심자들, 특히 프로그래밍 경험이 없는 분들이 많이 어려워 하는 부분이 바로 SAS 날짜값 다루기인것 같습니다. 특히 엑셀에서 DATA를 읽어들였을 때, 문자열을 날짜값으로 바꿔서 각종 연산을 하고자 할 때 뜻대로 안되는 경우가 많습니다. 여기서 SAS의 날짜값과 관련된 모든 것(?)을 다루어 보려고 합니다. 사실 몇 가지 기초적인 사실을 정확히 이해하면 참 편리하게 사용할 수 있는 것이 SAS에서 날짜값인데요, 많은 분들이 그냥 문자열로 처리하는 것을 더 선호하시는 편이죠. 앞으로 다음과 같은 질문에 답을 하면서 SAS의 날짜값 다루기를 정복해 보려고 합니다. 1. SAS에서 날짜값은 무엇인가?2. SAS에서 날짜값은 어떻게 만들어 지는가?3. 날짜값을 다루는 SAS함수는 어떤 것들이 있고 언제 쓰는가..
가조회란? 기록이 안남는 가짜 조회인가? 가상조회라느니 신용정보를 빌려온다느니 별의 별 얘기가 다 있는데 다 사실과 다르다. 심지어 신용조회없이 하는 조회라는 모순적인 설명도 있다. 이 업권에서 일하다 보니 그런것도 있겠고, 요즘 워낙 개인정보(특히 신용정보)에 대한 이슈가 연일 언론을 장식하다 보니 덩달아 지인들의 관심도 높아져 술자리에서 자주 '신용정보조회'라는 주제로 담소(?)를 나눌 기회가 많다. 가끔 원치않게 잘 못 연결된 고객의 민원전화를 받기도 하지만 이 때도 고객의 제 1 관심사는 신용정보조회 기록(?) 이다. 많은 사람들이 잘 못 알고 있는게 있는데 '기록에 남지 않는 조회' 라는 '가조회' 다. 가짜로 조회한다라는 뉘앙스가 물씬 풍기는 이 말은 사실이 아니다. 세상에 가짜로 조회하고 진..
금융 또는 상품시장에서의 투자위험을 회피하고자 하는 거액 투자자들을 대상으로 한 사모형식의 투자기금으로 출발하였으나, 최근에는 외환, 채권, 상품시장에서 단기 고수익을 목적으로 레버리지를 이용하여 자산규모를 크게 상회하는 투기적 포지션을 보유, 운용하고 있는 공격적 투자운용형의 사모형식 투자기금을 말한다. 규제회피를 위해 보통 100명 미만의 거액투자자로 구성되는데, 미국 증권거래위원회는 2006년 2월부터 15인 이상의 고객을 가진 헤지펀드에 대하여 등록을 의무화하였다. 전세계 헤지펀드의 총 자산운용규모는 2007년말 1.9조 달러를 기록하였으나 2008년 금융위기 이후 1.5조 달러 수준으로 줄어든 것으로 추정된다. 주식, 채권, 파생상품, 실물자산 등 다양한 상품에 투자해 목표 수익을 달성하는 것을..