2008年12月20日 星期六

2008年11月23号,我的论文"MFEprimer: Multiple factor evaluation of the specificity of PCR primers“被Bioinformatics接收,呵呵

MFEprimer: Multiple factor evaluation of the specificity of PCR primers

Wubin Qu 1,2, Zhiyong Shen 1, Dongsheng Zhao 3, Yi Yang 2,* and Chenggang Zhang 1,*

1Beijing Institute of Radiation Medicine, State Key Laboratory of Proteomics, Beijing 100850, China.
2College of Life Science, Sichuan University, Key Laboratory of Bio-Resources and Eco-Environment of MOE, Chengdu 610064, China.3Beijing Institute of Health Service and Medical Information, Beijing 100850, China.

*To whom correspondence should be addressed.

Abstract
Summary: We developed a program named MFEprimer for evaluating the specificity of PCR primers based on multiple factors, including sequence similarity, stability at the 3' end of the primer, melting temperature, GC content, and number of binding sites between the primer and DNA templates. MFEprimer can help the user to select more suitable primers before running either standard or multiplex PCR reactions. The cDNA and genomic DNA databases of 10 widely used species, as well as user custom databases, were used as DNA templates for analyzing primers specificity. Furthermore, we maintained a Primer3Plus server with a modified Primer3Manager for one-stop primer design and specificity checking.
Availability: The web service of MFEprimer is freely available at http://biocompute.bmi.ac.cn/MFEprimer/. A stand-alone version of MFEprimer can be downloaded at http://biocompute.bmi.ac.cn/MFEprimer/download/. Primer3Plus on our server is located at http://biocompute.bmi.ac.cn/MFEprimer/primer3plus.cgi. All programs are licensed under the General Public License (Free Software Foundation, 1991).
Contact: CZ (zhangcg@bmi.ac.cn)


Citation: Wubin Qu, Zhiyong Shen, Dongsheng Zhao, Yi Yang, and Chenggang Zhang. (2009) MFEprimer: multiple factor evaluation of the specificity of PCR primers, Bioinformatics, 25, 276-278.

2008年11月26日 星期三

Fedora 8下python程序向mysql数据库传送大文件碰到大小受限的解决办法

在Fedora 8下用python向数据库传送文件时碰到下面的错误:
_mysql_exceptions.OperationalError: (1153, "Got a packet bigger than 'max_allowed_packet' bytes")

解决办法:
在mysql的配置文件/etc/my.cnf中添加一行即可:

[mysqld]
set-variable = max_allowed_packet=4000000

修改后的my.cnf文件:

[mysqld]
datadir=/var/lib/mysql
socket=/var/lib/mysql/mysql.sock
user=mysql
# Default to using old password format for compatibility with mysql 3.x
# clients (those using the mysqlclient10 compatibility package).
old_passwords=1

set-variable = max_allowed_packet=40000000

[mysqld_safe]
log-error=/var/log/mysqld.log
pid-file=/var/run/mysqld/mysqld.pid

参考:
  1. http://blog.chinaunix.net/u/24274/showart_1274689.html
  2. http://www.madirish.net/tech/geocities/jkeane@madirish.net?article=115

2008年10月31日 星期五

文献管理综述

请看这篇文章,发表在PLoS Computational Biology,里面综述了基本上所有的文献管理的软件,包括你听到的以及很多你没听过的。

2008年10月30日 星期四

从NCBI下载基因序列


#!/usr/bin/env python
# -*- coding:utf-8 -*-
'''
读取文件(每行一个ID)中的GeneID,下载其序列,并保存到文件中
'''

__file__    = 'download_gene.py'
__date__    = '2008-10-30'
__version__ = '0.1'
__author__  = 'Wubin Qu <quwubin@gmail.com> @CZlab @BMI @CHINA'
__blog__    = 'http://quwubin.blogspot.com'
__license__ = 'GPL v3 License'

from Bio import Entrez

def read_id(file_name):
    '''从文件中读取GeneID'''
    id_array = []
    fh = open(file_name, 'r')
    lines = fh.readlines()
    for line in lines:
        id = line.strip()
        id_array.append(id)

    fh.close()

    id_array = ','.join(id_array)
    return id_array

def download_seq (id_array):
    '''根据GeneID下载相应格式的序列'''

    result_handle = Entrez.efetch(db="nucleotide", rettype="genbank",  id=id_array)
    result = result_handle.read()

    return result

def write_to_file(file_out_name, content):
    '''将序列写入文件中 '''
    fh = open(file_out_name, 'w')
    fh.write(content)
    fh.close()

def main():
    '''主控制程序'''
    file_name = 'id_list.txt'
    file_out_name = 'sequences.txt'
    id_array = read_id(file_name)
    result = download_seq(id_array)
    write_to_file(file_out_name, result)

if __name__ == '__main__':
    main()





注: id_list_txt文件结构如下:
6273291
6273290
6273289
即每行一个GeneID。

2008年9月23日 星期二

Mendeley: 很有潜力和市场眼光的跨平台文献管理软件

Mendeley 是一个发展中的文献管理软件,目前处于beta测试阶段,但其发展目标使得这一软件将成为EndNote等软见的有力竞争者,原因有:

  1. 免费;
  2. 跨平台;
  3. 桌面版和Web存贮结合;
  4. 具有共享功能,具有web2.0的气质;
  5. 能自动从pdf文件中提取文献信息(这个功能异常吸引人);
  6. 可以添加tag和comments;

还有一些其他功能可能正在添加之中,给我的感觉就是很有眼光,个人比较喜欢,虽然还没有成熟版发布。
桌面版安装在各个平台上都很简单,Web服务需要注册,熟悉CiteUlike等的人会非常喜欢这一功能。

2008年9月18日 星期四

Taverna工作台(2)

Taverna工作台是myGrid项目推出的一个可以设计和执行工作流的开源软件,它可以整合包括 NCBI,EBI,DDBJ,SoapLab,BioMOBY和EMBOSS等提供的网络服务和资源,目前已有上百种由世界各地的科学家设计的工作流可供 下载(http://www.myexperiment.org/workflows/all)。将我们需要重复操作的、具有顺序性的一系列工作设计为工 作流,可以节省我们大量的时间以及工作量。典型的一个生物信息学的分析工作就是从NCBI蛋白质RefSeq数据库中获得某一蛋白质的FASTA格式的序 列,再对其做BLAST获取其同源序列,然后对这一序列以及它的同源序列做多序列比对,最后再做系统发育分析;对这一工作已经有工作流 (http://www.myexperiment.org/workflows/124)可供使用,用户只需要输入初始蛋白质的序列接受号或者序列,剩 下的事情就可以交给Taverna来完成。

2008年9月14日 星期日

Taverna 工作台(1)

The Taverna workbench is a free software tool for designing and executing workflows, created by the myGrid project, and funded through OMII-UK. Taverna allows users to integrate many different software tools, including web services, such as those provided by the National Center for Biotechnology Information, The European Bioinformatics Institute, the DNA Databank of Japan (DDBJ), SoapLab, BioMOBY and EMBOSS.

Taverna 工作台是myGrid项目推出的一个设计和执行工作流的开源软件,受OMII-UK资助。Taverna可以整合很多的资源和服务,包括NCBI,EBI,DDBJ,SoapLab,BioMOBY和EMBOSS等提供的网络服务,但不限于此。