Header

  1. View current page

    hongiiv님의 노트

Profile_img_60x60_01
0

BioPipe 진행사항

http://bangdoll.myid.net/님이 2008년 5월 22일 10시 16분에 보낸 귓속말

당연히 살아있습니다 ^^; 다만, 학위논문 계획발표가 다음주 수요일이라 반쯤 정신이 나간 채로 일에 매달려 있죠 ㅠㅠ 아마도 다음주 목요일쯤에 밀린 글들 주루룩 읽으면서 행복해 하고 있을 겁니다 :)

http://bangdoll.myid.net/님이 2008년 1월 22일 09시 42분에 보낸 귓속말

넵 역사적인 첫 귓속말 메세지네요 ㅎㅎ hongiiv 님 좋은하루 되세요 :)

http://terra.myid.net/님이 2008년 1월 21일 22시 51분에 보낸 귓속말

핸드폰 수신설정을 하면, 문자로도 알려줍니다. 핸드폰번호를 모를때 이용하기 좋은 방법이지요. ^ ^

http://terra.myid.net/님이 2008년 1월 21일 22시 22분에 보낸 귓속말

앗! hongiiv님도 귓속말 아시는 군요. ^ ^

유전체 문제

  • 1_1 완성
  • 1_2 완성
  • 1_3 PPI 정보만 추가하면 됨 ^^

 

  • 2_1 완성
  • 2_2 완성
  • 2_3 마찬가지로 20개만 추출중 문제 발생, EbiWuBlast 작동문제 확인 요청 메일 발송

 

단백체 문제

  • 1_1 완성
  • 1_2 search의 결과중 ; 다음에 있는 gene symbol만을 추출하면 됨
  • 1_3 1_2를 끝내고 Ebi Interproscan 수행해야 함
  • 1_4 1_3을 끝내고 pathway 정보만 get하면 됨

 

  • 2_1 완성
  • 2_2 완성
  • 2_3 완성
  • 2_4 완성

 

 

기타사항

KOBIC의 고건환씨가 메일을 보내옴

Support의 연결툴 요청에 현재 2개의 연결툴 요청중 ^^;;

wsdbfetch_fetchdata의 결과는 fasta 포맷이고 nucleic_translation_transeq의 입력은 embl 형태라 안된다고 하는데 왜 나는 그냥 될까??

www.ebi.ac.uk/soaplab/emboss4/html/transeq.html 에서 transeq를 보면 sformat, osformat에 보면 모두 다 지원하는데 default로 하면 그냥 되던데 ^^;;

^^ 질문자가 잘못알고 있었던걸로 판명되었다.

 

wsdbfetch_fetchdata RefSeq:NM_005700, fasta, raw

 

OMIM의 search 결과중 라인의 맨 끝부분에 존재하는 gene symbol만을 추출하는 어답터 완료 OMIM_search_TO_seq

어답터의 결과값으로 RefSeq를 얻는 SequenceOME

지금 어답터 확인중에 있습니다. 근데 잘 안돌아 가는거 같기두 하고 ^^

 

 2007/09/12 19:15:28

nucleic_gene_finding_getorf로 찾은 서열을 sort하는 모듈 SortSeqByLen과 원하는 갯수만 추출하는 ExactSeqsAsOrder 모듈 추가

잘 작동하는지 확인중

 

2007/09/12 19:25:11

원하는 갯수의 서열만 추출하는 ExactSeqsAsOrder 에러 발생

 

 2007/09/13 10:46:49

SortSeqByLen, ExactSeqsAsOrder 에러 해결! 잘 작동됨

 

2007/09/13 13:08:09

ExactSeqAsOrder가 좀 이상함

EbiWuBlast는 multiple sequence가 가능한지??

 

2007/09/17 14:35:47

EBI WU-Blast 수행 문제

OMIM_search_TO_seq를 수행하여 genesymbol을 추출하고 seq를 얻기 SequenceOME, convert_GeneSymbol_to_Proteinseq에 넣을때 문제...^^

 

2007/09/18 13:33:55

multi 입력값인 경우 SequenceOME_file을 사용하라고 했다.

 질문

제가 잘못 이해하고 있는건지 아닌지 확인 좀 부탁드립니다.

단백체 1번 문제에 관한 것입니다.

OMIM 데이터베이스에서 질병관련 유전자를 search메소드를 이용해서 추출한 후 해당 gene에 대한 단백질 서열을 추출하기 위해서는

convert_genesymbol_to_ProteinRefseq를 통해 해당 단백질의 Ref를 얻은 후 이를 refseq2seq를 통해 해당 Ref에 대한 실제 서열을 얻는것으로 알고 있습니다.

 

그래서 search의 결과중 gene symbol만을 추출하기 위해 OMIM_search_TO_seq 메소드를 수행하면 여러개의 gene symbol을 얻을 수 있습니다.

문제는 이렇게 얻은 여러개의 gene symbol에서 ref를 얻기 위해 convert_GeneSymbol_to_ProteinRefseq, SequenceOME_file, SequenceOME를 사용하면 되는데,

multi 입력값은 sequenceOME_file만 되고 search와 sequeceOME_file는 String 결과와 file input이기 때문에 String2File을 통해 연결하면 될거라고 생각했습니다.

 

이게 맞는것인지, 맞다면 자꾸 String2File에서 에러가 발생합니다.

 

 

답변내용들

>OMIM search의 결과 중 뒷 부분에 있는 genesymbol만을 추출 해 내는 adapter를 OMIM_search_TO_seq 이름으로 설정 해 두었습니다.
>그리고 OMIM_search_TO_seq에서 출력 되어지는 multi의 결과 값으로 RefSeq를 얻을 수 있도록 omics/Genome, Task/Retrieve에 SequenceOME이라는 module을 등록 하였습니다.
>SequenceOME를 사용 하실때 Taxid input은 설정 해주시기 바랍니다.
그럼 좋은 pipeline 구축 하시기 바랍니다.

 

>안녕하세요~
convert_GeneSymbol_to_Proteinseq는 하개의 입력값만을 받게 되어 있는 web-services입니다. multi의 입력 값을 필요로 하는 경우 SequenceOME_file을 사용 하시기 바랍니다.

 

문제에서는 convert_GeneSymbol_to_Proteinseq을 사용하라고 했고,  첫번째 답변에서는 SequenceOME, 두번째는 SequenceOME_file ^^;; 헷갈리네요..


2007/09/28 10:58:32

마감 ㅋㅋㅋ

History

Last edited on 05/22/2008 10:16 by hongiiv

Comments (0)

You must log in to leave a comment. Please sign in.