BioPipe 진행사항
http://bangdoll.myid.net/님이 2008년 5월 22일 10시 16분에 보낸 귓속말
당연히 살아있습니다 ^^; 다만, 학위논문 계획발표가 다음주 수요일이라 반쯤 정신이 나간 채로 일에 매달려 있죠 ㅠㅠ 아마도 다음주 목요일쯤에 밀린 글들 주루룩 읽으면서 행복해 하고 있을 겁니다 :)
http://bangdoll.myid.net/님이 2008년 1월 22일 09시 42분에 보낸 귓속말
넵 역사적인 첫 귓속말 메세지네요 ㅎㅎ hongiiv 님 좋은하루 되세요 :)
http://terra.myid.net/님이 2008년 1월 21일 22시 51분에 보낸 귓속말
핸드폰 수신설정을 하면, 문자로도 알려줍니다. 핸드폰번호를 모를때 이용하기 좋은 방법이지요. ^ ^
http://terra.myid.net/님이 2008년 1월 21일 22시 22분에 보낸 귓속말
앗! hongiiv님도 귓속말 아시는 군요. ^ ^
유전체 문제
- 1_1 완성
- 1_2 완성
- 1_3 PPI 정보만 추가하면 됨 ^^
- 2_1 완성
- 2_2 완성
- 2_3 마찬가지로 20개만 추출중 문제 발생, EbiWuBlast 작동문제 확인 요청 메일 발송
단백체 문제
- 1_1 완성
- 1_2 search의 결과중 ; 다음에 있는 gene symbol만을 추출하면 됨
- 1_3 1_2를 끝내고 Ebi Interproscan 수행해야 함
- 1_4 1_3을 끝내고 pathway 정보만 get하면 됨
- 2_1 완성
- 2_2 완성
- 2_3 완성
- 2_4 완성
기타사항
KOBIC의 고건환씨가 메일을 보내옴
Support의 연결툴 요청에 현재 2개의 연결툴 요청중 ^^;;
wsdbfetch_fetchdata의 결과는 fasta 포맷이고 nucleic_translation_transeq의 입력은 embl 형태라 안된다고 하는데 왜 나는 그냥 될까??
www.ebi.ac.uk/soaplab/emboss4/html/transeq.html 에서 transeq를 보면 sformat, osformat에 보면 모두 다 지원하는데 default로 하면 그냥 되던데 ^^;;
^^ 질문자가 잘못알고 있었던걸로 판명되었다.
wsdbfetch_fetchdata RefSeq:NM_005700, fasta, raw
OMIM의 search 결과중 라인의 맨 끝부분에 존재하는 gene symbol만을 추출하는 어답터 완료 OMIM_search_TO_seq
어답터의 결과값으로 RefSeq를 얻는 SequenceOME
지금 어답터 확인중에 있습니다. 근데 잘 안돌아 가는거 같기두 하고 ^^
2007/09/12 19:15:28
nucleic_gene_finding_getorf로 찾은 서열을 sort하는 모듈 SortSeqByLen과 원하는 갯수만 추출하는 ExactSeqsAsOrder 모듈 추가
잘 작동하는지 확인중
2007/09/12 19:25:11
원하는 갯수의 서열만 추출하는 ExactSeqsAsOrder 에러 발생
2007/09/13 10:46:49
SortSeqByLen, ExactSeqsAsOrder 에러 해결! 잘 작동됨
2007/09/13 13:08:09
ExactSeqAsOrder가 좀 이상함
EbiWuBlast는 multiple sequence가 가능한지??
2007/09/17 14:35:47
EBI WU-Blast 수행 문제
OMIM_search_TO_seq를 수행하여 genesymbol을 추출하고 seq를 얻기 SequenceOME, convert_GeneSymbol_to_Proteinseq에 넣을때 문제...^^
2007/09/18 13:33:55
multi 입력값인 경우 SequenceOME_file을 사용하라고 했다.
질문
제가 잘못 이해하고 있는건지 아닌지 확인 좀 부탁드립니다.
단백체 1번 문제에 관한 것입니다.
OMIM 데이터베이스에서 질병관련 유전자를 search메소드를 이용해서 추출한 후 해당 gene에 대한 단백질 서열을 추출하기 위해서는
convert_genesymbol_to_ProteinRefseq를 통해 해당 단백질의 Ref를 얻은 후 이를 refseq2seq를 통해 해당 Ref에 대한 실제 서열을 얻는것으로 알고 있습니다.
그래서 search의 결과중 gene symbol만을 추출하기 위해 OMIM_search_TO_seq 메소드를 수행하면 여러개의 gene symbol을 얻을 수 있습니다.
문제는 이렇게 얻은 여러개의 gene symbol에서 ref를 얻기 위해 convert_GeneSymbol_to_ProteinRefseq, SequenceOME_file, SequenceOME를 사용하면 되는데,
multi 입력값은 sequenceOME_file만 되고 search와 sequeceOME_file는 String 결과와 file input이기 때문에 String2File을 통해 연결하면 될거라고 생각했습니다.
이게 맞는것인지, 맞다면 자꾸 String2File에서 에러가 발생합니다.
답변내용들
>OMIM search의 결과 중 뒷 부분에 있는 genesymbol만을 추출 해 내는 adapter를 OMIM_search_TO_seq 이름으로 설정 해 두었습니다.
>그리고 OMIM_search_TO_seq에서 출력 되어지는 multi의 결과 값으로 RefSeq를 얻을 수 있도록 omics/Genome, Task/Retrieve에 SequenceOME이라는 module을 등록 하였습니다.
>SequenceOME를 사용 하실때 Taxid input은 설정 해주시기 바랍니다.
그럼 좋은 pipeline 구축 하시기 바랍니다.
>안녕하세요~
convert_GeneSymbol_to_Proteinseq는 하개의 입력값만을 받게 되어 있는 web-services입니다. multi의 입력 값을 필요로 하는 경우 SequenceOME_file을 사용 하시기 바랍니다.
문제에서는 convert_GeneSymbol_to_Proteinseq을 사용하라고 했고, 첫번째 답변에서는 SequenceOME, 두번째는 SequenceOME_file ^^;; 헷갈리네요..
2007/09/28 10:58:32
마감 ㅋㅋㅋ
History
Last edited on 05/22/2008 10:16 by hongiiv
Comments (0)