메뉴 건너뛰기

[38] FASTQ 에서 점수 가져오기

jhan 2017.01.15 21:30 조회 수 : 8

FASTQ 파일은 FASTA 파일에 Quality 점수 정보가 추가된 파일로 기계에서 읽힌 서열들이 얼마나 믿을만한지를 나타냅니다. FASTQ의 파일 구조는 다음과 같이 ID, 서열, 구분자(+) 그리고 점수인 총 4줄로 이루어 져있습니다.

 

  FASTQ의 점수는 0에서 93사이의 Phred quality score를 사용하며, 흔히 사용하는 Sanger format은 Phred quality score에 33을 더하여 ASCII code로 나타낸 것입니다. Q(sanger) = -10 log(10) p. 예를 들어, 한 base 의 점수가 ‘C’인 경우, C를 아스키로 변환한 값인 67에서 33을 뺀 34점입니다.

  다음 주어진 서열의 평균값이 주어진 기준인 30이상인 Read 의 개수를 구해보세요.

 

힌트)

>>> ord(‘A’)

65

>>> ord(‘!’)

33

 

https://raw.githubusercontent.com/KennethJHan/Bioinformatics_smalltalk_Python50/master/Q38.fastq.gz

위로