sosal.kr
so_sal :: ORF vs Coding sequence (cds) 차이점
http://www.sosal.kr/896
ORF vs Coding sequence (cds) 차이점. Made by so Sal. Https:/ www.biostars.org/p/47022/. Open Reading Frame (ORF) vs Coding sequence (CDS). DNA sequence는 6가지 reading frame이 존재한다. Double strand로 존재하기 때문에, 상보서열까지 총 6가지의 경우의 수가 존재한다. 이 모든 reading frame에서 존재할 수 있는 Start codon 'ATG' (not always) 에서부터 Stop codon (TAA, TAG, TGA)으로 둘러쌓인 sequence를 ORF라고 할 수 있다. 'Protein coding region'의 가능성을 가진 위치를 뜻한다. MRNA 서열은 하나의 CDS 서열 전체를 포함한다. Hg18 데이터 Hg19로 liftover 하기. DNA Mutation - 돌연변이의 종류. ORF vs Coding sequence (cds) 차이점.
sosal.kr
so_sal :: DNA Mutation - 돌연변이의 종류
http://www.sosal.kr/898
DNA Mutation - 돌연변이의 종류. Made by so Sal. 돌연변이(Mutation): 세포의 DNA를 구성하는 nucleotide가 바뀌는 현상. DNA에서의 돌연변이는 결국 암호화되는 단백질 구조에 기능에 영향을 미치거나, 세포내의 다양한 역할을 하는 RNA의 구조, 기능에 영향을 미쳐 기능의 변화가 유발시킨다. 따라서 생체는 돌연변이를 방지하고 복구하는 기작도 갖추게 되었다. 돌연변이는 크게 체세포 돌연변이(Somatic mutation), 생식세포 돌연변이(Germline mutation)로 구분된다. 체세포 돌연변이는 암유전자 형성 등의 예가 있으며, 해당 세포에만 영향을 주기 때문에 자손에게는 유전되지 않지만, 난자 및 정자에 해당하는 생식세포 돌연변이는 자손에게 유전되므로 종의 유전적 풀(pool)에 영향을 미칠 수 있다. 유전적 변이는 크게 점 돌연변이와 염색체 수준의 돌연변이로 구분된다. 1) 치환 돌연변이 (Substitution mutation). Missense ...
sosal.kr
so_sal :: 방명록
http://www.sosal.kr/guestbook
201610.05 08:29 신고. 와, 이거 대박 신기! 201609.04 10:53 신고. 이것이 게임화면 창으로 좌표는가는대 클릭을 못하는대 원래 게임창쪽으로가면 클릭안되는지요? 키보드역시 메모장에서는 잘 입력이되는대 게임화면으로가면 입력이안되내요. 201608.30 15:58 신고. 너무 많이 배워갑니다. 감사합니다. 특히 오토클릭 프로그램 너무 잘 쓰고 있습니다. 그런데 혹시 오토마우스 반복 시간 설정을 클릭과 키보드 따로 구분해서 설정 할 수는. 201608.31 04:06 신고. 프로그램 2개 키시고 하나는 마우스용, 하나는 키보드용으로 사용하세요. 201608.17 16:32 신고. 안녕하세요 Pharmacology 기본지식 정리는 비밀 번호가 걸려있던데, 공부에 도움이 될꺼 같아서 보고싶은데 볼수 없나요? 201608.17 16:57 신고. 201608.16 07:33 신고. 201608.16 07:37 신고. 어떤 내용이 도움이 되셨나요? 201602.20 10:59 신고.
sosal.kr
so_sal :: RNASeq 플랫폼 선정원칙 및 플랫폼 주요 특성
http://www.sosal.kr/919
RNASeq 플랫폼 선정원칙 및 플랫폼 주요 특성. Made by so Sal. RNASeq (RNA seqeencing)은 Microarray의 정확도 및 Saturation 문제를 비롯하여 novel transcript, Alternative splicing case 등을. 잡아낼 수 있는 장점이 있어서 최근 Transcriptome analysis에서 아주 많이 사용되고 있다. RNASeq 데이터를 생산해내는 플랫폼이 다양하지만, 어떤것을 써야 하느냐에 대한 답은 없다. 일반적으로 PubMed에서 비슷한 실험 및 연구에 사용된 데이터의 플랫폼을 따라가는 것이 쉬운 답이지만 실험의 디자인 및 실험 과정 또한 빠르게 바뀌고 있기 때문에, 따라가는 것 역시 항상 옳은 방법이 될 수 없다. 따라서 일반적인 실험디자인 원리를 통해 플랫폼을 결정하는것이 합리적이며, 이를 위해 RNASeq을 고를 때 어떤 특성들이 존재하는지 확인하는 것이 좋은 방법이다. 2 Reads: How many do I need?
sosal.kr
so_sal :: R에서 특정 문자, 문자열 제거하기
http://www.sosal.kr/895
R에서 특정 문자, 문자열 제거하기. Made by so Sal. Find0 라는 파일에 integer pair가 저장되어 있는데. 끝에 " 라는 문자때문에 프로그래밍 안에서 바로 연산을 할 수 없는 상황이었습니다. Sosal@sosalr tmp]$ head ./find0. Pair - read.table("find0", sep=" , header=FALSE, stringsAsFactors=FALSE). 이렇게 읽게 되면 V1, V2 column이 다른 형태의 변수로 읽어지게 됩니다. Integer로 읽혀야 할 것이, character로 읽혀저 버립니다. Asinteger(gsub(" " , " , pair[,2]). Gsub을 이용하여 " 라는 문자열을 모두 공백문자로 바꿔주고, interger 형태로 형변환을 해주면 완료됩니다. R ggplot 누적분포 및 계단형 그래프 그리기. R - graph (Network) plot, 네트워크 그래프. R에서 특정 문자, 문자열 제거하기.
sosal.kr
so_sal :: R - graph (Network) plot, 네트워크 그래프
http://www.sosal.kr/923
R - graph (Network) plot, 네트워크 그래프. Made by so Sal. 그래프 데이터의 표현방식은 다양하다. 데이터는 아무런 의미가 없는, 제가 마음대로 만든 matrix 입니다. 인접행렬은 column, row의 구성이 같아야 하며 n by n matrix를 이룬다. 따라서 column, row에 있는 목록이 곧 vertex가 되며, n-Adjacency matrix의 경우 n개의 vertex가 존재할 것이다. Vij가 곧 vertex를 연결하는 direct를 의미하며,. 예제파일 (위의 matrix를 csv로 변환한 파일입니다.). 라이브러리 설치가 안됐다면, install.packages("igraph") 로 간단하게 설치 가능. Dat - read.csv("adjacency matrix.csv", header=TRUE, row.names=1,sep=","). M dat - as.matrix(dat). 예제파일 (위의 matrix를 csv로 변환한 파일입니다.).
sosal.kr
so_sal :: Hg18 데이터 Hg19로 liftover 하기
http://www.sosal.kr/903
Hg18 데이터 Hg19로 liftover 하기. Made by so Sal. Hg는 UCSC browser에서 사용되는 Human genome reference 명명법입니다. Hg* 은 UCSC의 명명법이며, 또 다른 Release name도 가집니다. List of UCSC genome releases. Genome Reference Consortium GRCh38. Genome Reference Consortium GRCh37. NCBI Build 36.1. 예를 들어 Hg18는 NCBI36 이라는 Release name도 가지고 있습니다. Link - https:/ genome.ucsc.edu/FAQ/FAQreleases.html. Human genome version에 따라 유전체의 길이나 유전자의 위치가 다릅니다. Hg18의 chr, position를 Hg19의 것으로 옮기기 위해 UCSC liftover를 사용하면 되지만, 새로 mapping 하는것이 권장됩니다. 하지만 새로 mappi...
sosal.kr
so_sal :: 다중회귀 LASSO regression, selection과 shrinkage
http://www.sosal.kr/868
다중회귀 LASSO regression, selection과 shrinkage. Made by so Sal. 연구나 실험 등, 다양한 분야에 걸쳐서 '모형의 단순화'는 매우 중요하다. 간결함의 원리(principle of parsimony). 는 어떤 실험 결과나 현상에 대해 설명할 수 있는 변수들이 많은 경우,. 그것을 가장 잘 설명할 수 있는 변수는 결국 '간단한 설명' 혹은 '최소한의 설명'이 된다는 것이다. 이는 14세기 초기 영국 철학자 윌리엄 오캄이 주장했다. 간결함의 원칙은 여러 설명변수를 면도날로 정리하여 최소한의 설명변수만 남겼기 때문에, 오캄의 면도날이라고 한다. 이는 바로, 어떤 현상을 설명하는 데 있어, 불필요하게 복잡한 가정을 세워서는 안된다는 것이 핵심이다. 통계 모델링에서 간결함의 원리. 복잡한 설명보다 단순하고 간단한 설명이 좋다. 모형에 있어서 모수는 가능한 적게 가지고 있어야 한다. 선형 모델이 비선형 모델보다 좋다. 유의하지 않은 교호작용 항목을 제거한다.
sosal.kr
so_sal :: 'Programing/R- programming' 카테고리의 글 목록
http://www.sosal.kr/category/Programing/R-%20programming
Programing/R- programming'에 해당되는 글 41건. WARNING: Only g version 4.6 or greater can be used with RcppArmadillo. R: Chisq post hoc. 다중 카이제곱검정. Visual studio에서 R studio를 사용해보자. R - unable to open connection to X11 display. R - Linux에서 tar.gz 파일로부터 패키지 설치하기. R - rJava 설치 에러날 때. R - 반복측정(paired) 자료의 분석. R을 이용한 데이터 이상치 검출법 정리. R ggplot 누적분포 및 계단형 그래프 그리기. R - graph (Network) plot, 네트워크 그래프. R에서 특정 문자, 문자열 제거하기. 다중회귀 LASSO regression, selection과 shrinkage. 카플란 메이어 (kaplan meier) 생존분석 - R. 리눅스에서 R 가로넓이 조절하기.