졸업 논문관련 TLSH 의 해시 값 생성 및 비교 과정 설명
파일을 슬라이딩 윈도우 하여 5바이트씩 읽힌다. 5바이트씩 잘라서 읽힌 값들은 pearson 함수를 통하여 int 값들로 읽히게 되고 (0,2,5,127..등등등) 0~127 까지의 int 값 안에서만 형성됨. why? 파일의 차이점 비교를 위해 128 차원으로 파일을 읽도록함 읽힌 여러 값들은 각각이 카운팅 되어 카운팅 된 값들을 128차원 배열에 저장한다. 총 카운팅 된 값들은 컴퓨터가 읽을수 있는 이진법으로 변경해주어야 한다. 단 변경 과정에서 조건이 있다. 예를 들어 4분위수 를 주어서 Xi < 1분위수(10) 이면 00 대입 1분위수