热门搜索 :
考研考公
您的当前位置:首页正文

DNAStar详细中文使用说明书

来源:伴沃教育


Sequence Analysis Software for Macintosh and Windows

GETTING STARTED

Introductory Tour of the LASERGENE System MAY 2001

DNASTAR, Inc. 1228 South Park Street Madison, Wisconsin 53715 (608) 258-7420

Copyright . 2001 by DNASTAR, Inc.

All rights reserved. Reproduction, adaptation, or translation without prior written permission is prohibited,except as allowed under the copyright laws or with the permission of DNASTAR, Inc.

Sixth Edition, May 2001

Printed in Madison, Wisconsin, USA

Trademark Information

DNASTAR, Lasergene, Lasergene99, SeqEasy, SeqMan, SeqMan II, EditSeq, MegAlign, GeneMan, Protean,MapDraw, PrimerSelect, GeneQuest, GeneFont , and the Method Curtain are trademarks or registered trademarks of DNASTAR, Inc. Macintosh is a trademark of Apple Computers, Inc. Windows is a trademark of Microsoft Corp. ABI Prismtrademarks of Applera Corp., ALF

Disclaimer & Liability

DNASTAR, Inc. makes no warranties, expressed or implied, including without limitation the implied warranties of merchantability and fitness for a particular purpose, regarding the software.

DNASTAR does not warrant, guaranty, or make any representation regarding the use or the results of the use of the software in terms of correctness, accuracy, reliability, currentness, or otherwise. The entire risk as to the results and

performance of the software is assumed by you. The exclusion of implied warranties is not permitted by some states. The above exclusion may not apply to you.

In no event will DNASTAR, Inc. and their directors, officers, employees, or agents (collectively DNASTAR) be liable to you for any consequential, incidental or indirect damages (including damages for loss of business profits, business interruption, loss of business information and the like) arising out of the use of, or the inability to use the software even if DNASTAR Inc. has been advised of the possibility of such damages.

Because some states do not allow the exclusion or limitation of liability for consequential or incidental damages, the above limitations may not apply to you.

DNASTAR, Inc. reserves the right to revise this publication and to make changes to it from time to time without obligation of DNASTAR, Inc. to notify any person or organization of such revision or changes. The screen and other illustrations in this publication are meant to be representative of those that appear on your monitor or printer.

373, 377 and 3700 are registered

is a registered trademark of Pharmacia Biotech A.B.,

MacVertor. and GCG. are registered trademarks of Pharmacopeia, Inc.

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 2 -

目录

在苹果机(Macintosh)上的安装与升级 05

通过因特网升级 06 软件安装 网络安装 疑难解答 12

在PC机(Windows)上安装与升级

通过因特网升级 软件安装

从 EditSeq 开始 21 从 GeneQuest 开始 31 从 MapDraw 开始 44 从 MegAlign 开始 54 从 PrimerSelect开始 65 从 Protean 开始 78 从 SeqMan II 开始 89

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

07 08 17 18

- 3 -

19

L A S E R G E N E

f o r

Wi n d o w s & M a c i n t o s h

DNASTA R I n c . ( 6 0 8 ) 2 5 8 - 7 4 2 0 f a x : ( 6 0 8 ) 2 5 8 - 7 4 3 9 e m a i l : s u p p o r t @ d n a s t a r. c o m

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 4 -

在苹果机(Macintosh)上的安装与升级 通过因特网升级

必备条件 6 下载升级程序 6

软件安装

必备条件 7 从CD安装Lasergene 7

网络安装

必备条件 8 定义 8

Dongle安装 10

服务器安装 10 终端机安装 11

疑难解答

系统配置冲突及网络问题 12 解决网络问题的其他工具 13 授权错误报告 14 程序使用及更多的授权信息 15

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 5 -

通过英特网升级

如果您以前已经安装了Lasergene 而且目前有升级和服务联系,您就可以通过英特网来升级您现有的版本,各种模块(module)都是以自解压形式存储的,你可以选择性的下载安装。

必备条件

您的用户名和会员号是必需的,可以在安装盘上找到。

程序升级

备份您已有的Lasergene,找到您要升级的程序,并把它转移到备份的文件夹中。连接到DNAstar网站的主页(),从菜单中的Customers中点击Lasergene Updates点,安提示输入密码和用户名(与会员名相同),这样就会打开下载页面,找到Macintosh软件(Macintosh Software),就可以下载您想要的模块了。

模块下载完毕以后,双击文件将其解压缩到已经安装的DNAstar文件夹中替换旧的模块文件。

用Macintosh Finder打开Lasergene浏览器,找到DNAstar文件夹,从选择Update Applications,然后插入安装盘,等待升级完毕。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 6 -

软件安装

本节介绍若何从CD在苹果机(Macintosh)上安装Lasergene。注意安装是尽量关闭所有其它程序以保证安装顺利进行。 必备条件

一张个人的Lasergene安装盘; 一张Lasergene软件光碟;

足够的硬盘空间和内存:至少30Mb的硬盘,32Mb的RAM。

从光盘安装Lasergene

插入安装盘和安装光盘,双击图标,续则出现安装窗口。 窗口中有两种安装选择:简易安装和一般安装。 简易安装可以运行于68K-family and Power Macintoshes。

而一般安装可以安装工作站文件、执行文件和样品资料,我们推荐使用简易安装,如果使用一般安装可以节省5Mb的空间。 注意安装完毕后,要重新启动计算机。

则出现下面的窗口,点击继

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 7 -

网络安装 Lasergene网络系统是可以运行于局域网计算机上的软件。他有两部

分组成:一是资料服务器,服务器要有较大的硬盘和较高的运行速度;二是与服务器相连的终端机。后者通过一个称为dongle的

Lasergene硬盘设备相连进行管理。

必备条件

安装磁盘(服务器版)

客户端磁盘,包括安装盘(终端版)和Disk 1(终端版)。

Lasergene软件光盘

DNAstar网络用dongle

盘足够的硬盘空间和内存:服务器至少30Mb的硬盘,8Mb的RAM。终端机至少1Mb的硬盘,32Mb的RAM。

定义

在安装Lasergene网络系统之前要熟悉以下术语:

 应用程序:指EditSeq, GeneMan, GeneQuest, MapDraw,

MegAlign, PrimerSelect, Protean, and SeqMan II。  应用程序服务器:是指存储应用程序的电脑,通常与dongle服务器

是同一个服务器,但也可以不同,当在局部硬盘上安装网络程序时,也可以在同一个网络系统中同时存在多个不同的应用程序服务器,

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 8 -

而且应用程序服务器不一定是苹果机,储存应用程序的机器也不一定必须能够运行该程序,仅仅是储存而已。

 终端机安装(又称工作站安装),安装网络版本Lasergene运行的

最小软件部分,它包括以下在内:LicenseKeeper,Navigator,和系统资源。

 终端机:这可以是任何不作为Dongle Server的网络上的机器。终

端机是任何最少穿过终端机安装的机器,这样是使得Lasergene应用程序运行需要的最少、最低限度的软件。

 Dongle:Dongle是网络版Lasergene需要的硬件装置。每个网络

系统都需要单独的Dongle。dongle是末端上带1个短的电缆的小的矩形的装置。有2不同的种类的dongles:一种是在计算机背后可与调制解调器端口连起来,有9个pin插头;另一种有4个别针阳插头,连接鼠标和键盘。

 Dongle服务器:这是装有Dongle的机器,它肯定是最少穿过终端

机安装的苹果计算机,这机器应该始终保持运行。

 Navigator:是为了更简单的进行Lasergene应用设计的工具。在

必要的情况下,Navigator将自动安装网络组件,而且为网络安装诊断工具。

 LicenseKeeper:和Dongle交流的持有人的系统扩展部分。它告

诉dongle哪个应用被开始,这样,dongle才允许末个机器程序运行。

 服务器安装: 指Lasergene软件的完整安装,包括应用程序、

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 9 -

Navigator和系统资源。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h- 10 -

LicenseKeeper、

Dongle安装

使Lasergene网络版能够运行的第一个操作就是安装dongle。在你安装之前,请检查你的dongle是否有9-别针连接器(connector)或4-别针连接器(connector)。

 关闭你打算装dongle服务器那台苹果计算机的电源。

 如果你的dongle有9-别针连接器(connector),把它连接到你的

计算机调制解调器的端口上。调制解调器端口是一个有9个外置接口的设备,位于你的苹果计算机的后面的展示板上,电话听筒图标的附近。

 如果你的dongle有4-别针连接器,从键盘断开鼠标,把dongle接

在键盘上,接着,把你的鼠标接在dongle上。  重新启动苹果计算机。

 如果你的dongle被接在苹果计算机上,你必须按照dongle服务器

那样进行软件安装。如果你打算将这机器作为文件服务器,请安服务器安装的方法安装。如果你不打算将这机器作为文件服务器,请安终端机安装的方法安装。在对dongle服务器施行功的软件安装之后,在启动时应该出现右面的服务图标。

服务器安装(Server Installation)

 这个安装和在第5页上所描述的软件安装过程基本相同的。由于大部

分的网络包括机器很多的不同的种类的(68 K,和Power

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 11 -

成器

Macintosh机器),所以我们推荐您选择简易安装。

 在完成软件安装之后,如右图操作共

享Lasergene应用程序文件夹,这样,其他的网络用户才可以使用。如果你不能确定怎样操作,请和你的网络管理员联络。

终端机安装(Client Installation)

 终端机安装必须在全部需要对Lasergene服务器操作的机器,但不

是文件服务器的机器。

 插入安装磁盘终端机版本,然后按照在第5页上软件安装的方法安

装。

 随后通过苹果机菜单的选择命令将文件服务器和终端机相连。一些

网络可以使用其他的方法进行相连。如果这步你有问题,请和你的网络管理员联络。

 从终端机上的DNASTAR文件夹中运行浏览器。

 从文件菜单,选择寻找应用程序,你应该收到如下信息:全部应程

序用都被浏览器找到了。

现在就可以从文件服务器运行Lasergene应用程序了。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 12 -

疑难解答

系统配置冲突

一些系统配置可能会在安装过程冲突,如果你不能从Lasergene光盘成功地安装,可以关上不必要的配置:

 用计算机控制板上的配置管理器关闭任何不必要的扩展程序。  或重新启动你的机器,继续安装。

网络疑难

找不到dongle服务器是网络问题中最常见的问题。当你开始运行DNASTAR应用程序时,你会遇到这问题,提示信息显示:DNASTAR许可服务器没有应答,请再试一次。可能有以下几个原因:

 是否装有dongle的计算机被关闭,如果是重启dongle机器即可。  是否dongle没有接在苹果计算机上,或者不在调制解调器端口或鼠

标接口,按照第8页Dongle Installation命令在苹果计算机上重新安装dongle。记住在除掉或者插入dongle之前先关闭计算机。  如果你的dongle被接在IIfx,Quadra 900或Quadra 950等机子

上,你不仅需要重新安装,还要进行如下操作:  从菜单中选择Control Panels中的Serial

Switch双击,就会出现右面的窗口。  将Faster 换成Compatible。然后重启计算

机。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 13 -

 如果dongle已适当地被接在调制解调器端口上,但是计算机不识

别,那可能是你的计算机在 booting 期间里不是别调制解调器端口的记号。用LicenseKeeper按下面的方法寻找调制解调器端口:  启动Navigator。  按Option——NETWORK

MENU——Set

LicenseKeeper的顺序打开右边的LicenseKeeper对话框。  把Dongle Delay参数放到3秒上。  单击LicenseKeeper,接着Done。  重启苹果计算机。

 如果问题还没解决,和DNASTAR联络。

其他解决网络问题方法

要了解您的计算机和全部可通过网络运行DNASTAR的 dongle服务器,选择NETWORK MENU中的Diagnose LicenseKeeper。计算机将告诉您是否dongle被安装到你的计算机上,是否存在LicenseKeeper系统配置。同时显示LicenseKeeper

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 14 -

站点识别和版本编号。无论你的计算机的授权状态如何,Navigator都会报告所有已连接的dongle服务器的状态。许可服务器报告在网络地带附近形成,可显示全部对你的网络应答的dongle服务器的用户名,站点识别和版本编号。通常,你的LAN包括单一的dongle服务器,但是,大的网络上可以有几个。如果你的计算机被接在大的LAN上,打开这个报告可能会慢一些。确定全部LicenseKeeper服务器的地点要求network request被送到在LAN上每个区。至少需要1秒钟才能确定是否有回应。

LicenseKeeper错误报告

如果授权系统没有安装,或者和dongle服务器连接困难,Navigator将会发现问题,报告错误信息。下面斜体为错误类型,其后是各自的原因。

 LicenseKeeper系统扩展没在系统文件夹或扩展文件夹中。重新安装Lasergene客户端软件。Navigator不能和系统扩展连接,也没

在系统文件夹中发现。对于System 7或较晚的Macintoshes,如果你重启计算机时按下Shift键,则可能发生这问题。

 当计算机起动的时候,按下了鼠标按钮或Shift键。重启你的机器。

因为系统扩展在启动时被失活了,所以Navigator不能和系统扩展交流。

你的机器上安装了较老版本的Mac机网络协议。安装53或更新版本的Mac机网络协议。安装的Mac机网络协议不支持系统扩展。在小的网络

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 15 -

或closely-knit的安装上,这将不是问题,因为dongle服务器与其他的客户机在同一个区。如果必要,DNASTAR能为较新版本的Mac机网络协议(AppleTalk)提供驱动和installation script。

 不能在网上注册LicenseKeeper。和DNASTAR联络。由于你的计

算机上有太多的其他的网络处理,系统扩展不能进行网络操作。这种情况很少见,但如果您的计算机是网络中介的话,有时也会发生。  LicenseKeeper系统扩展所需的内存不够。关闭不必要的系统扩展。如果你的操作系统在你的计算机上使用了全部的内存,这也会发生。。

 系统文件夹被保护。去除系统文件夹保护,重启计算机。系统文件

夹里的文件和已经使用的文件不能够保存。磁盘压缩和口令保护的扩展时会发生这些问题。

 重新安装Lasergene工作站软件。系统扩展使用的系统文件夹里的

文件不存在了。

应用程序的使用

为了了解已连接的用户的数目,用户使用了什末程序,程序使用的时间,可以从NETWORK MENU打开Application Usage。窗口中还会显示有关诸如客户/服务器状态,站点识别和LicenseKeeper系统扩展的版本编号等一般信息。当这窗口打开时,Navigator将没10秒钟更新一次应用程序的使用信息。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 16 -

更多的LicenseKeeper信息

计算机启动时,LicenseKeeper将自动寻找网络的区信息和每个区的dongle服务器。只有标识号与LicenseKeeper系统扩展相符的dongle服务器才能够被识别。这允许1台以上dongle服务器在相同的网络的范围内操作。如果网络管理员改变了有dongle服务器的区名并重新启动dongle服务器,那末区外的所有终端机也必须重新启动。

系统扩展作为Dongle Server成功启动时,在启动期间会出现这个图标。

系统扩展作为终端机成功启动时,在启动期间会出现这个图标。 系统扩展被安装,但是由于较少的内存或失活(启动时按下了鼠标)而不能启动时会出现这个图标。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 17 -

WINDOWS上的安装与升级 通过因特网升级

必备条件 18 下载升级程序 18

软件安装

必备条件 从CD安装Lasergene

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

19

- 18 -

19 通过英特网升级

如果您以前已经安装了Lasergene 而且目前有升级和服务联系,您就可以通过英特网来升级您现有的版本,各种模块(module)都是以自解压形式存储的,你可以选择性的下载安装。

必备条件

您的用户名和会员号是必需的,可以在安装盘上找到。

程序升级

备份您已有的Lasergene,找到您要升级的执行程序,并把它转移到备份的文件夹中。

连接到DNAstar网站的主页(),从菜单中的Customers中点击Lasergene Updates点,安提示输入密码和用户名(与会员名相同),这样就会打开下载页面。

找到windows软件(Windows 95/98/NT Software.),就可以下载您想要的模块了。

模块下载完毕以后,双击文件将其解压缩完毕。

看到“Application name” has been updated.说明升级完毕。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 19 -

软件安装

本节介绍若何从CD在PC机(Windows)上安装Lasergene。注意安装是尽量关闭所有其它程序以保证安装顺利进行。 必备条件

一张个人的Lasergene安装盘; 一张Lasergene软件光碟;

足够的硬盘空间和内存:至少30Mb的硬盘,32Mb的RAM。

从光盘安装Lasergene

插入安装盘和安装光盘,双击安装图标,则出现下面的窗口,点击继续则出现安装窗口。

随后一次出现下面窗口,请按照提示做出选择然后点击Next,直至完成安装。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 20 -

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 21 -

从EditSeq开始 EditSeq是能够迅速、正确地输入,并且修改DNA或蛋白质序列工具。每个EditSeq文件都可以分为三个可编辑的部分,上边的一部分为序列文件,中间的一部分里是评论,底部是序列的注释。

EditSeq能读取大部分的序列格式——包括FASTA,GenBank,ABI、GCG和ASCII格式。你可以使用菜单命令或拖拽方式输入序列文件。另外, 序列也许通过使用键盘输入,或者从其他地方复制、粘贴得到。经Entrez或BLAST检索得到的序列可以直接从因特网或企业内部互联网服务器下载。

序列被打开后,EditSeq能使用标准或者指定的遗传密码进行翻译,或者反翻译,寻找开放读框,还可以进行阅读校对。另外, EditSeq能以GenBank,FASTA和GCG格式输出序列。

如果在使用这软件中需要帮助,可以和DNASTAR联络。电话:(608)258-7420,传真:(608)258-7439,电子信件:,或者经.

内容

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 22 -

打开已有序列 23 寻找开放读框 24 DNA序列翻译 24 遗传密码选择使用 25 遗传密码修改 25 序列的反向互补及反向转换 26 BLAST检索 27 序列信息查看 28 序列校读 29 序列的保存与输出 29

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 23 -

打开已有序列

我们从用苹果计算机打开“TETHIS21MA”和用Windows打开“tethis21.seq”开始。

假设序列的末尾有载体序列污染。我们在用EditSeq打开序列的同时,用Set Ends命令去除5’和3’污染序列。  从文件菜单(),选择Open。

 打开文件夹“Demo Sequences”单击选定序列“TETHIS21”。  单击位于对话框右下角的Set Ends按

钮。Set Ends被打开(如右)。  在5’框和3’框中键入50和850,点

击OK。单击Open打开序列。

当EditSeq窗口打开时,序列长度显示在右上角。通过“setting ends,”现在你只有最初序列中的801 bp的片段。Set Ends选择在全部Lasergene应用程序中都可以使用。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 24 -

寻找开放读框

在这入门的一部分中,我们将确定序列中最大的ORF,并翻译它。  从SEARCH MENU找到

ORF,点击打开会出现右边的对话框。

 单击Find Next寻找第一个ORF的位置。

 继续点击Find Next直到你把ORF的位置选定在位置183-455。

ORF的坐标会出现在EditSeq窗口的顶端附近。

DNA序列翻译

这一节中我们介绍如何翻译我们的ORF,不过任何序列中的读框内部分都可以用下面的方法进行翻译。如果你的选择是在三联码的读框内,

三联码指示棒显示为实心黑线(如左图)。如果你的选择是不在三联码的读框内,左边的箭头和右面的箭头显示向左或向右移动一个bp,以使所选序列成为三的倍数。

 选定ORF,从GOODIES MENU菜

单中选择翻译(Translate)。  翻译的蛋白质序列出现在一个新的未

命名窗口中(如右图)。它是使用标准的遗传密码翻译的。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 25 -

使用其它遗传密码

根据你的序列的来源,你可以选择使用非标准的遗传密码进行翻译等操作。在这节中,我们将标准的遗传密码转换成Ciliate Macronuclear密码 。

 从GOODIES MENU菜单选择Genetic

Codes打开,子菜单显示如左。  单击“Ciliate Macronuclear”就实现了

遗传密码的转换,EditSeq现在使用的就是Ciliate Macronuclear的遗传密码。  同样可以将遗传密码转换为其它类型。

遗传密码的编辑

这一节中我们修改Ciliate Macronuclear的遗传密码。  从GOODIES MENU菜单选择

Edit Selected Code。这将打开右面的窗口,窗口显示遗传密码是怎样翻译DNA和RNA序列的。  如以DNA形式展示密码,点击

DNA按钮。

 编辑时,单击任何要编辑的密码,

从其目前的位置拖到新氨基酸对应的位置则可。

 如使用不同的启始密码子,单击Set Starts按钮。第二的遗传密码

窗就会被打开,可以进行起始密码子选择。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 26 -

 单击任何氨基酸(或者codon位置),该密码子就会变成绿色,而

且旁边出现一个箭头,它就被设定为起始密码子了。如要去除,只需单击它即可。如不保存,则单击取消;如要保存,单击保存为。

序列的反向互补及反向转换

下面的步骤可以用于反向测定的序列的正确输入。  选定序列。

 从GOODIES MENU菜单,选反向互补序列(Reverse

Complement),或者把序列颠倒过来(Reverse Sequence)命令,则被选定的序列就被翻转互补或翻转过来了。

BLAST检索

下面我们将在NCBI的BLAST服务器上对TETHIS21序列进行相似性比较。注意为了进行BLAST查找必须保证因特网的连接。如果你没有连接因特网,跳过这部分,继续下一部分。  选定序,或者从EDIT菜单中选择Select All。  从网络检索菜单(NET

SEARCH MENU),选择BLAST查找。BLAST对话框就会出现。

 程序默认为blastn,数据库默认是nr,参数转换请参照帮助。  单击OK开始查找。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 27 -

 寻找结果显示为两部分(如下)。上边的部分是按可能性的顺序显示

检索到的序列的名字,下面的部分显示上面部分选定序列与提交序列(上边序列)比较的具体结果。有关

“score”和“expectation”的详细的信息在NCBI’s网点——.——可以找到。一般来说,更主要的score和更低的expectation提示较好的相似性。

 BLAST结果窗最上边的3钮被用来打开,或者保存检索到的序列,

或者让你了解更多的有关信息。

下面我们从用“Create Document”钮来打开评分最高的5序列开始:  单击Create Document。一个

小的对话框出现。

 在左上角有一个下拉菜单显示

默认(default)。单击下拉菜单,选顶端(Top)。并在右面的文本框中写入5。

 单击OK,EditSeq自动查对多余序列。如果EditSeq提示至少2

序列是同一个,请点击OK。EditSeq将从因特网数据库下在单一的序列,并分别打开一个单独的EditSeq窗口。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 28 -

下面我们用“Batch Save”钮将3-10序列保存为EditSeq文件:  选定从顶端起第3个序列。单击Batch Save。小的灰色的对话框

出现。

 单击下拉菜单,选Next。并在右面的文本框中写入8。  点击Set Location,显示文件夹对话框。

 选定你要保存序列的位置。单击OK回到灰色的对话框。  单击OK保存序列,文件扩展为“.seq”。在下载过程期间,EditSeq

自动查对重复的序列。如果EditSeq提示至少2序列是同一个,请点击OK。

 除非你收到错误信息,否则可以认为你的序列已经成功下载。

最后我们可以使用“Launch Browser”钮查看序列的详细信息  选定序列。  选择

Launch

Browser。  你的网络浏览器

将打开右面的窗口。

序列信息查看

现在我们要使用EditSeq菜单指令查看有关打开的TETHIS21序列的

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 29 -

信息。

 选定序列的一部分。如果你倒是希望全选序列,从EDIT MENU菜

单,选择Select All。

 从GOODIES MENU菜单,选DNA Statistics。就会出现右面的

窗口,显示序列信息。

序列校读

在我们学习保存和输出序列之前,下熟悉一下EditSeq的校读功能 这功能能帮助你校正测序胶中的错读。  选定序列。

 单击校对发音图标(序列窗口底部张开的嘴),或者从SPEECH

MENU,选Proof-Read Sequence。

 电子的音声就会开始朗读所选的序列。(注:如果你听不见任何声

音,检查你的计算机的喇叭是否已经打开。)

 要改变音声read-back的速度,从SPEECH MENU菜单,选择

Faster or Slower。

 要停止校读,点击图标(手),或者从SPEECH MENU菜单,选择

Proof-Read Sequence。

序列的保存与输出

首先创建一个用于保存的序列。从文件菜单,选New中的New DNA,或者New Protein。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 30 -

 将序列写入出现的窗口。

 如果你输入非法字符,计算机会发出警告。 然后,我们将序列保存为EditSeq文件:  从文件菜单,选Save。  选定保存位置。  给序列命名。  单击保存则可。

以GenBank或GCG格式保存序列:  从文件菜单,选Export。  选定保存位置。  为sequence(s)选格式。  给sequence(s)命名。  单击保存则可。 以FASTA格式保存序列:

 从文件菜单,选Export(1个序列),或者Export All As One(多

个序列)。当使用Export All As One的时候,如果DNA和蛋白质文件同时存在,激活窗口的序列类型与你保存的类型是一致的。EditSeq仅仅将写入的序列保存为FASTA格式。  选定保存位置。  选FASTA格式。  给sequence(s)命名。  单击保存则可。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 31 -

从GeneQuest开始 GeneQuest可以帮助你发现和注释DNA序列中的基因,并帮助您操作生物学所关心的DNA的其他feature:包括ORFS、拼接点连接,转录因子结合为点、重复序列、限制性内且酶酶切位点等。通过应用“methods”到序列,序列的feature可以以图形的形式展示出来。你可以在序列上注释任何你发现的feature。和其它的Lasergene应用程序一样,GeneQuest也提供整合的BLAST和Entrez寻找功能。

GeneQuest能直接打开DNASTAR,ABI和GenBank文件。其他格式的序列文件也可以使用EditSeq改为DNASTAR格式。如果你知道Genbank序列的登录号或名称,你可以直接打开序列。另外,你还可以在Entrez数据库进行序列查找和输入。

如果在使用这软件中需要帮助,可以和DNASTAR联络。电话:(608)258-7420,传真:(608)258-7439,电子信件:,或者经.

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 32 -

内容 打开已有分析文件 33 GeneQuest的DNA分析方法 34

用分析方法操作 方法参数改变 结果展示优化 Feature注释 BLAST检索 Entrez Database检索 GeneQuest的其他特点 保存分析文件

35 36 37 38 39 41 42 43

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 33 -

打开已有分析文件

在这一节中,我们将对已有的GeneQuest文件(也叫做GeneQuest分析)“Nematode R01H10.”进行操作。

 从文件菜单,选择Open打开

一个和右边相似的窗口。  在苹果计算机上,从Show菜

单中选择

GeneQuestDocument文

件。在Windows上,从文件类型菜单(Files of Type)的中选择GeneQuest Documents。

 用文件管理系统打开名为“Demo Sequences.”的文件夹。双击

Nematode R01H10,就可以打开下面的窗口。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 34 -

GeneQuest的DNA分析方法

打开GeneQuest文件后,下一步是选择应用方法。应用方法后,结果的图形显示可以帮助你了解序列上感兴趣的features。打开序列后,你会发现只有几种方法应用后的结果展示在窗口内。在下一部分中,我们将学习如何把其它方法用于我们序列的分析。  Title——给文件取名。  Ruler——在文件中加入标尺。  Sequence——显示文件中的序列。  Patterns-Matrix——方法的运算参数。  Patterns-Signal——转录因子结合位点数据库。

 Patterns-Type-In Patterns——使用键盘输入运算所需的Pattern参

数。

 Repeats-Inverted Repeats——寻找反向重复序列。  Repeats-Dyad Repeats——寻找Dyad重复和palindromes。  Repeats-Direct Repeats——寻找正向重复序列。

 Gene Finding - DNA Finder————在打开的DNA序列中寻找指

定DNA序列。分别显示正义连和反义连的寻找结果。

 Gene Finding - Protein Finder——在打开的蛋白质序列中寻找指定

DNA序列的翻译序列。显示结果为全部6个读框。

 Enzymes-Restriction Map——用DNASTAR酶目录中的酶分析打开

的序列,并以图形方式展示。

 Coding Prediction - Borodovsky——用Borodovsky’s Markov方法

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 35 -

来识别潜在的基因编码区,并以图形方式展示。

 Coding Prediction - Starts Stops ORFs——根据指定的ORFs的最小

长度,寻找可能的开放读框,可以选择是否需要起始密码子。读框的启始和中止点分别展示。

 Coding Prediction—Local Compositional Complexity——根据

Shannon信息学原理寻找有基因编码提示信息的区域。

 Base Contents-Base Distribution——序列上4种碱基、A+T和G+C

的频率、分布,以及AT和gc分布区域。  Bent DNA - Bending Index——DNA折叠预测。

用分析方法操作

调用新的GeneQuest方法的步骤是:从More Methods中选择方法,加入方法帘(method curtain),待方法运行完毕后,选择性的拖取结果放入分析界面(assay surface)即可(见右图)。在本节中,我们使用Bent DNA - Bending Index方法进行分析。  从

ANALYSIS

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 36 -

MENU选择Show Available Methods可以打开方法帘,也可以通过拖动分析界面左上角的小环的打开方法帘。方法帘中包括已经用于分析的全部方法。

 你将注意到方法帘没有Bent DNA - Bending Index method。在方法

帘的顶端,点击More Methods打开一个下拉菜单,其中尤可以用于分析的所有方法,点击Bent DNA - Bending Index method,该方法就进入了方法帘。

 若查看方法帘中的方法是否已经被应用,点击其右边的三角形。如

果图标前有数字表明该方法已经使用,数字表示应用的次数。因为我们还没有应用Bent DNA - Bending Index,所以点击三角形,会发现图标前没有数字。

 点击白颜色的位置去除对图标的选择。  单击选定“Bend Region,”,将其拖到分析

界面,释放鼠标。序列中可能会折叠的区域就会以小盒子的形式显示出来。

方法参数改变

下面我们改变方法的参数,然后将分析结果与参数改变前的结果进行比较。

 重复前面的操作,在方法帘中加入一个新的Bent DNA - Bending

Index,并把它拖如分析界面。现在你应该有2个完全一样的折叠区分析结果。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 37 -

 双击方法帘中任何一个结果,将打开一个参数对话框。

 改变弧长度参数为30,单击OK。分析界面上就会出现根据此参数计

算得到的结果。

(注:如果你再次拖入新的方法时,参数的改变会自动应用到新的方法上)。

结果展示优化

 组合或移动展示的结果:单击位于GeneQuest窗口左侧的调色板工

具中的的选择器(手图标),在分析界面中可以随意拖动任何展示的结果到任何位置。

 改变方法格式:单击目的选择器(手图标),可以选择分析界面上

的任何方法。从OPTIONS MENU菜单选择Line Color,打开彩色选择子菜单。选定颜色后,方法题目和结果显示都将变成那个颜色。另外,你可以用类似的指令进行操作:Line Weight、 Fill Color and Fill Pattern。

 去除方法:单击选择方法帘中显示的方法,用退位或删除键去除应

用的方法即可。

注意任何你除掉的方法都是能从Methods menu菜单再一次被使用。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 38 -

注释Features

当你用Genbank输入序列时,序列中标注的Features会自动转换为图形命令显示在方法帘中。这些Features 可以象任何别的方法那样拖到分析界面上显示。

GeneQuest也允许你为你的DNA序列制作新Features:  单击位于GeneQuest窗口的左侧的调色板工具(箭图标)。  然后点击选定2641-4257的Informative Region。

 点击调色板工具(铅笔图标),或者从SITES & FEATURES MENU

选择New Featur,打开一个Feature Editor对话框(如右图)

 你打开Feature Editor时,

首先进入Location设定。点

击“Info region”进入Title box,点击“Segment A”进入Segment Name box,接着,在对话框的底部选择标题和区段名字的位置。  点击Description按钮进入新的Feature Editor窗口。如果你愿意,可

以在note中对Feature做标注,在key种选择Feature的种类。  点击Style按钮进入最后的Feature Editor窗口,选择字型,大小和颜

色,以及你喜欢图型用于新建的feature。

 点击OK关闭Feature Editor窗口。一个图形化展示的“Info region”

就会出现在分析窗口的底部。

下面我们把新建的feature与另外一个feature整合起来。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 39 -

 单击调色板工具(箭图标)。选定你刚做好的feature,单击工具调

色板工具上的(链图标)。

 然后点击名为“R01H10.4——CDS.”的feature,再点击连接(链

图标)。

 这样你的“Info region”featur将继续作为没有联系的方法而存在,

但是,它的拷贝将作为R01H10.4featur的一部分出现。

BLAST检索

GeneQuest为你的序列在因特网或企业内部互联网数据库上进行相似性检索提供2不同的方法。BLAST Selection指令允许你使用序列的任何一部分进行检索。BLAST ORF需要你首先选择序列的ORF,然后他就可以自动翻译,在蛋白质数据库中进行检索。在这一节中,我们用BLAST在NCBI上检索与Nematode R01H10相似的序列。

注意必须保证您的计算机与因特网相连。否则,跳过这一部分。  单击范围选择器调色板工具(箭图标)。

 如同在右边被显示的那样,单击任何“R01H10.5”的feature。注意

此时选定的仅仅是外显子部分(exons),内含子部分被自动去除。  从网络检索菜

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 40 -

单,选BLAST Selection。会出现左面的BLAST对话框。  不做参数改变,这样,程序

是blastn,数据库是nr。  单击同意开始查找。

寻找结果显示为两部分(如下)。上边的部分是按可能性的顺序显示检索到的序列的名字,下面的部分显示上面部分选定序列与提交序列(上边序列)比较的具体结果。有关\"score\"和\"expectation\"的详细的信息在NCBI's网点--可以找到。一般来说,更主要的score和更低的

expectation提示较好的相似性。BLAST结果窗最上边的4钮被用来打开,或者保存检索到的序列,或者让你了解更多的有关信息。“Put In Document”按钮相当于Gene Finding - DNA Finder,在打开序列中寻

找检索到的序列。(如果我们使用blastp或blastx,则相当于Gene Finding-Protein Finder)

 在BLAST结果窗口中选择一个检索结果。  单击Put In Document。保存对话窗将打开。  选定保存位置,并命名。单击保存。

 你选的序列将象应用方法那样以短的垂直的竖线自动出现在分析界

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 41 -

面的底部。垂直的竖线显示BLAST结果的位置。

 可以选择Zoom in/OUT来放大或缩小视野。直到你能清楚地查看序

列。

 其他按钮与EditSeq中介绍的功能相同。

Entrez Database检索

GeneQuest允许你在因特网或企业内部互联网的Entez数据库上进行检索。检索到的结果可以输入GeneQuest(或者EditSeq),或者保存为序列文件。在这一节中,我们将检索与狨视觉色素(visual pigment in marmosets)序列有关的序列,然后学习GeneQuest或EditSeq是如何打开其中的一个序列的。

 从网络检索菜单(NET SEARCH MENU),选择新正文查找(New

Text Search)来打开Entrez Query窗口(如右)。  在文本框中敲入

“visual pigment.”。

 从默认为“All Fields”的下拉菜单中选择“Text Word.”。  用鼠标从右面再拖入一个检索框(New Term)。

 在文本框中敲入“Callithrix”,从“New Fields”菜单中选“Organism”。  单击查找。查找结果出现于Entrez Results窗口(如下)。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 42 -

 双击任何Entrez Results窗口里的序列,就可以查看其详细信息。

如果你想在GeneQuest或EditSeq里打开其中的一个序列:  从Entrez Results窗,单击你想打开的序列。

 从网络检索菜单,选择用GeneQuest或者EditSeq打开(Open with

GeneQuest/Open with EditSeq)。

 选定文件保存的位置,并给文件取名。单击同意(视窗),或者保

存(苹果计算机)。

如果你选择以GeneQuest打开文件,GeneQuest将打开文件并且将其默认的方法自动应用到序列上。如果你做选择以EditSeq打开文件,Entrez序列将在主窗口中显示。

GeneQuest的其他特点

以RNA折叠形式查看序列的一部分:

 选定目的序列,在ANALYSIS MENURNA菜单中选择Fold as

RNA命令。

序列酶切,模仿agarose凝胶电泳判定大小:  打开方法帘(method curtain)。

 从More Methods中选择Enzymes - Restriction Map 加入方法

帘。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 43 -

 单击图标左边的蓝色三角形,打开内切酶一览表。注意方法帘仅仅

显示那些最少切割一次DNA序列的酶。刚打开酶一览表时,所有的酶都被选中了,在空白处单击一下去除选定。

 选定特定的酶,拖入分析界面,即可

以看见该酶的酶切位点在序列上的位置。

 从SITES & FEATURES MENU菜

单选泽Agarose Gel Simulation。  新窗口即显示酶切片段在

electrophoretic的分离情况(如图)。

保存分析文件

 从文件菜单,选保存。

 选定文件的保存位置。给文件命名。  单击保存。

 你所应用和展示的所有信息都会被保存。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 44 -

从MapDraw开始 根据实验设计,分析和实验结果的展示需要的不同,MapDraw可以制作6种类的酶切图。从简单的线性图到有注释的环形图,在展示限制性酶切位点的同时,还可以同时展示序列的feature,六个读框及其翻译结果。MapDraw也以自动展示从GenBank输入序列的features。

你可以按照位置、酶切频率等来排列你的酶切位点。另外, 你可以用手工选任何酶切位点的结合。酶切位点过泸器(filters)也可以使用Boolean operators联合使用。

MapDraw工具能使你规划酶切位点和克隆实验,产生详细,充分地结果概括。和全部Lasergene应用程序一样,MapDraw也提供整合的BLAST查找功能。

如果在使用这软件中需要帮助,可以和DNASTAR联络。电话:(608)258-7420,传真:(608)258-7439,电子信件:,或者经.

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 45 -

内容 新酶切图制作 46 过泸器类型 47 应用频率过泸器 47 应用手动过泸器 48 使用过泸器一览表 49 使用Must Cut Here/Don’t Cut Here调色板工具 50 酶信息显示 51 环形展示 51 ORF图 52 显示择选 53 保存,退出 53

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 46 -

新酶切图制作

我们以组氨酸DNA序列“TETHIS21MA”(苹果计算机)和“tethis21.seq”(视窗)为例。首先我们寻找能够切割组氨酸DNA序列的酶切位点。

 从文件菜单选择New打开右

边的对话框。

 打开“Demo Sequences.”

文件夹。

 双击打开TETHIS21(见下)。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 47 -

过泸器类型

过泸器(filter)是你定义的可以使用的酶切位点的集合。在你自定义过泸器之前,所有酶切位点都会用于序列分析。你可以用和/或来组合过泸器。

MapDraw内置的过泸器如下:

 Overhang过泸器是根据一套你定义的Overhang准则归类的酶切

位点。这些准则包括3’和5’端突出,与别的酶切位点互补以及兼并的末端突出。克隆试验中,可以使用这个过滤器寻找互补末端。  频率(Frequency)过泸器是指根据出现于指定的范围序列上的频

率归类的酶切位点。我们将在本节的下一部分中使用这个过泸器型。  种类和复杂性过泸器(Class & Complexity)是根据酶切位点种

类归类的酶切位点。这些种类包括:I型(随机)把II型(明确),或者I型+II型。这过泸器也可以根据位点复杂性、价钱和来源进行归类。

 手动选择过泸器(Manual Pick)允许你按需要选定酶切位点。在

随后的一部分中,我们学习使用手动选择过泸器的方法。  Must Cut Here/Don’t Cut Here调色板工具也是一种过滤器,

随后进行阐述。

频率过泸器应用

首先让我们用频率过泸器来删除任何可以两次切割我们序列的酶。  从ENZYME MENU,选New Filter,然后Frequency打开参数对

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 48 -

话框。

 在Min和Max对应的框中输入数字1和2,其他的参数不变。这个设

定将我们序列中切割多于两次的位点自动删除。  在过泸器名字框中,输入“Two-cuts-max.”。

 单击Apply将过泸器用于序列分析——然后OK退出参数对话框。你

将注意到在图上酶切位点的数目现在大大地减少了。

应用手动过泸器

虽然减少了大约3分之2的位点,但是还有100以上的酶存在。我们还可以设定一些更严紧的命令进行限制。看一看我们的酶是否能整齐地用来切割TETHIS21序列的编码区。

 从MAP MENU选Linear Minimapp。打开的窗口显示每个限制酶

切割位点的位置。

 滚动窗口,直到你看到大的向右的箭头,上写“histone”。“Histone”

是在最初的Genbank入口被注释的序列特点。当我们打开它的时候,这个特点和序列一起输入。  单击选定它。  在屏幕的左

上单击种类调色板工具(Sort),接着选择Sort by Cuts Close to Selection。酶切位点即刻分类,这样,距特点最近而且超出选定范

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 49 -

围的酶切位点将会排在最上面。

 滚动到窗口的最顶端。你将注意到,在histone基因的左和右有2酶

切位点:Acs I和Apo I。两个酶切位点对我们来说都是理想的。 现在我们将制作仅仅包括Apo I酶切位点的Manual Pick filter。  从ENZYME MENU,选New Filter——然后Manual Pick。打开

酶切位点过泸器编辑器。

 把Apo I从右边的窗口拖进左边的窗口。给过泸器取名。在这我们

把过泸器叫做“Apo I.”。

 点击Apply——然后OK,就保存并应用

“Apo I.”过泸器了。

 注意到现在线性的minimap仅仅由Apo

I酶切位点和histone特点构成。

使用过泸器一览表

现在我们已经应用了2个过泸器:一个叫做“Two-cuts-max”的频率过泸器和叫做“Apo I.”的手动过滤器,MapDraw会自动把两个过泸器的结果用“AND,”联合起来应用,这样,展示的结果需要满足两个标准:切割一或两次,用Apo I切割。我们手动过滤器包括频率过泸器的单一切点的内容,所以他自动的覆盖了频率过泸器的结果。下述过泸器一览表允许我们随意编辑、组合各个过泸器。

 从Map Document,单击过泸器调色板工具(在窗左上的漏斗图

标)打开过泸器一览表(如下)。当前应用的所有过泸器都出现于

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 50 -

窗口的左边。

 为了除掉Apo I过滤器,

点击选中它,从左窗口拖到右边的窗口,单击

应用即可。现在由于只有Two-cuts-max过泸器被应用,所以序列上的酶切位点数目立即增加了。

 把Apo I过滤器拖回,放在And旁,单击Apply再次应用Apo I过滤

器,序列上的酶切位点数目又立即减少了。(如果把Apo I过滤器拖回,放在Or旁,单击Apply再次应用Apo I过滤器,序列上的酶切位点数目不会改变,因为Apo I过滤器是Two-cuts-max过泸器的一部分)。

 按上面的方法把两个过滤器都去除。

使用Must Cut Here / Don’t Cut Here调色板工具

Must Cut Here / Don’t Cut Here工具是另一种酶切位点过滤限制方法。我们将用这个方法再次重复上面的操作。  从MAP MENU,选Site & Sequence。

 向下滚动,直到你看在大的向右指的箭头,上写“histone”。 单击选中。点击Don’t Cut Here调色板工具(红色园圈起的剪刀样图标),去除所有切割选定区的酶切位点。(点击Must Cut Here工具——剪刀样图标——序列上将展示所有切割选定区的酶切位点。) 这样,仅仅剩下那些不切割选定区的位点。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 51 -

显示酶信息

内切酶编辑器(Enzyme Editor)使你能够查看内切酶的各种相关信息,包括其名字,识别序列,isoschisomers,种类,价格,销售公司和有效性等详细的信息。你对这些信息可以进行添加或删除操作。

 打开酶编辑窗(如左),双击任意一个

酶的名字。

 箭头显示酶识别序列和切割位点。  你可以按照“GeneQuest”上的方法

在序列上添加新Feature,并作注释。

环形展示

你可以以环形图展示环形或线性序列,但是,如果序列是线性的,MapDraw会提示你。如果你想在环形序列上进行酶切位点限制,那末,我们前面提到的Don’t Cut Here filter完全可以做到这一点。  通过点击过滤器调色板工具检查当前是否只有Don’t Cut Here过

泸器应用。如果已经应用,则Don’t Cut Here过泸器应该在过泸器一览表的左边的窗口里,而其他的过滤器在右边。如果这不是这样,请进行调整。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 52 -

 从MAP MENU,选择Circular Illustration,打开左边的窗口。(如

果此时有太多的酶切位点,你可以加入其他的过泸器)。  通过OPTIONS MENU的Drawing Size调整图画的大小。2条红线

相会的角是你可以做的最小图画的范围。在窗口内点击任何位置,图形大小将显示为那末大。  单击同意。

ORF图

 从MAP

MENU,选ORF Map打开右边显示的六读框的开放读框窗

口。默认的终止和开始codons可以使用指定的遗传密码。方法见EditSeq。

 从OPTIONS MENU中选择ORF Criteria可以设定参数。你能调整

最小的ORF长度,定义上游启动子和距上游启动子的距离,选定后单击同意即可。

 放大ORF以查看翻译的序列。方法是点击调色板工具中Zoom In (有+的图标),接着,单击分析界面。重复这些2步直到你能看翻译。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 53 -

显示选择

MapDraw’s OPTIONS MENU提供各种指令允许你做下面的事情:  选择1个或3个字母的编码。

 显示不同的读框组合(Reading Frames 或 Line Layout)。  编辑用于翻译的遗传密码(Genetic Codes and Edit Selected

Code)。酶显示可以选择垂直或者水平展示。  线性化环形序列(Linearize Sequence)。  显示不确定位点。

保存退出

 从编辑菜单(EDIT MENU),选保存地图(Save Map)。  选择保存位置,命名。

 单击保存(苹果计算机)或同意(视窗)。

 从文件菜单(),选择放弃(苹果计算机)或者退出(视窗),电

脑提示保存或放弃;选择保存,则你操作的所有结果都会保存起来,否则结果会全部丢失。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 54 -

从MegAlign开始 MegAlign提供6列队(aligment)方法,进行DNA和蛋白质序列的配对和多序列比较(multiple aligment)。多序列比较(multiple aligment)可以在MegAlign 的worktable进行查看和编辑。可以根据队列(aligment)的结果制作进化树(Phylogenetic trees),并且,有关序列距离的数据和残基替代可以容易地作成表格。一般多序列比较(multiple aligment)的结果展示于队列(aligment)窗口,相似性和差异用彩色的直方图展示。和全部Lasergene的应用程序一样,MegAlign也提供整合的BLAST查找功能。

如果在使用这软件中需要帮助,可以和DNASTAR联络。电话:(608)258-7420,传真:(608)258-7439,电子信件:,或者经.

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 55 -

内容 创建队列文件 56 序列设置 57 Pairwise Alignment 58 使用 Dot Plot Method 59 多序列比较 59 Phylogenetic Tree查看 61 查看队列报告 62 Decorations/Consensi 62 MegAlign文件保存 64

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 56 -

创建队列文件

MegAlign提供两种基本的队列方法:配对比较和多序列比较。配对比较可以比较任何2个选定的序列的相似性,而多序列比较对在Worktable中所有序列进行比较。在我们入门的第一个部分中,我们将介绍使用2不同的种类的配对比较方法。我们将从创建一个MegAlign文件,输入两个histone序列开始。

 从文件菜单,选Enter Sequences打开Enter Sequences对话框。  从你DNASTAR文件夹中

的“Demo MegAlign,”文件夹,双击打开“Histone

Sequences.”文件夹,左上两个序列是我们选用的序列。

 单击TETHIS21,点击Add钮。单击TETHIS22,点击Add钮。现

在2序列将出现于右面的窗口。  单击Done把序列输入Worktable。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 57 -

 从OPTIONS MENU,使用Size 命令增加Worktable的字形大小

直到可以看清楚。

序列设置

下面我们练习subranging输入的histone序列。设置序列的末端在我们这个例子中并不重要,但是当两个序列匹的全序列匹配不太好,或是蛋白质和DNA的混合序列时就变得非常重要了。后者要求每个DNA序列都必须是给出正确的翻译读框。序列设置可以通过给定末端位置手动操作设置,也可以通过特定标注的feature进行。这里,我们将使用histone H2B-1的CDS进行操作。  点击选中(TETHIS21)。

 从OPTIONS MENU,选Set Sequence Limits,接着,从Feature

Table打开右面的序列末端设置窗口。  顶端的histone

H2B-1-- CDS feature已经选定。下面显示的是选定序列的特点名字和范围。

 单击Change the Rest用相同的feature设置第二histone序列。你

将自动回到Worktable,这时,设置后的序列就出现了。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 58 -

配对比较(Pairwise Alignment)

MegAlign提供各种配对比较方法。我们序列是DNA,我们可以用的方法是Wilbur-Lipman,Martinez-Needleman-Wunsch和Dotplot。在这入门中,我们在使用Wilbur-Lipman的方法。  同时选中两个序列。

 从ALIGN MENU中的One Pair选择Wilbur-Lipman方法。  使用默认参数进行比较,点击OK。

 MegAlign计算队列,然后在另一个窗口显示比较结果。 窗标题展示相似指数(所右匹配残基的百分比),缺口数目,全的缺口长度和一致

序列长度。我们可以改变标志颜色来区别匹配和不匹配的序列。  单击队列调色板工具(有“x”方框图标),打开下面的队列颜色编

辑读化框。

 单击深蓝色的方框,接着点击Match Color右面

的黑色方框,他就变蓝了。所有和一直序列一样的碱基都立即变成深蓝色。如此重复可以改变不匹配的序列的颜色。

 另外,还可以通过选定或不选彩色选择方框下面的方框查看队列窗

口中队列的变化。如你单击Vertical Bars,则匹配序列间的碱基变

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 59 -

成了垂直的棒。

使用点划分方法(Dot Plot Method)

点划分方法是先把要比较的序列叠加起来,然后计算匹配不当的数目。

 同时选定两个序列。

 从ALIGN MENU中的One Pairl

里选择Dot Plot打开右面的窗口。

 单击OK用默认的参数进行比较。

MegAlign计算结果会在另一个窗口显示出来。

每个匹配都与特定的一组残基有特定的相似性(两个都设计在参数对话框中),Dot Plot窗口中展示为蓝色。从左侧末端开始的红色斜线,表示两个序列比较的位置。

 双击任意一条蓝色的线会打

开左面的窗口,其中显示所选定的序列的比较结果。

多序列比较

为了在MegAlign中进行多序列比较,我们选择一个含有十四个相关的钙调蛋白序列的文件进行操作。使用这个大的数据库我们可以制作进化树,了解MegAlign的其他特性。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 60 -

首先,我们要创建一个包括14 calmodulin序列的新文件:  从文件菜单,选Open打开DNASTAR文件夹的“Demo

MegAlign”的文件夹。

 双击打开“Calmodulin Alignment”。

 从OPTIONS MENU,使用Size命令增加字体大小到看得清楚为止。 现在我们需要选MegAlign’s的两个多序列比较方法中的一个进行操作:Clustal或者Jotun Hein。如果已知序列有一定的同源性,我们推荐使用Jotun Hein,并且,如果有关序列相关性的背景未知,可以选择Clustal。我们使用的序列已知全部是calmodulins,所以,我们使用Jotun Hein方法。

在我们实行队列之前,我们应该选择一个权重表。MegAlign’s残基权重表用于对多序列比较进行评分,这样那些虽然残基不匹配,但残基化学性质相似的序列的评分要比化学性质不相似的序列的评分要高。我们的序列是蛋白质,并且我们将使用Jotun Hein方法,所以“Structural”表是最好的选择。

 从ALIGN MENU选择Set

Residue Weight Table打开左面的窗口。  从上面的下拉菜单选择

Structural。单击同意。 现在我们可以比较我们的

calmodulin序列了。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 61 -

 从ALIGN MENU选择Jotun Hein Method。  队列进程窗显示比较完成的百分比。

 当队列完毕,Worktable会显示队列的结果。

 通过VIEW

MENU中的Sequence Distanc查看序列的差别和相似性

(如左)。

 通过VIEW MENU中的Residue Substitutions查看残基的替代数

目(如右)。

 为了继续,关上Residue

Substitutions and Sequence Distances窗口。

Phylogenetic Tree查看

 通过VIEW MENU中的Phylogenetic Tree打开下面的窗口。默认

为Balanced Branches调色板(从顶端第3)。在phenogram中,

距离长度近似。  为了用

cladogram查

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 62 -

看结果,单击Unbalanced Branches调色板工具(从顶端第4)。在cladogram中,枝长度(branch length)是与祖先的节差异的评估。

 为了继续这入门,关上Phylogenetic Tree窗口。

查看队列报告

队列报告以序列显示比较的结果。  通过VIEW MENU中的

队列报告命令(Alignment

Report)打开报告窗口。  MegAlign允许你改变

队列报告的外观。从OPTIONS MENU中选择Alignment Report Contents打开右面的窗口,选定第3-7和第9个方框,其它不变。  单击同意,更新报告。

创建Decorations和Consensi

另外,我们可以通过加入“decorations”和“consensi.”来优化展示的效果。Decorations包括加框、加阴影和隐藏。在这节中,我们将给那些与一致序列不一致的氨基酸加阴影。

 从OPTIONS MENU选

择New Decoration来

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 63 -

打开在左边显示的对话框。

 在题目框中,输入类似“Shade disagreements with

consensus.”的名字。

 下一个排包括3下拉的菜单。选择第一个下拉菜单中的“Shade“,

中间菜单的“residues differing from”。第3个菜单不变,默认为Consensus。选择第一个下拉菜单中的“Shade“后,会激活其下面的另外两个下拉式菜单。

 从上边的菜单选择颜色,从下面的菜单选择阴影的样式。  距离单位框不变,为“0.”。

 单击同意,现在队列报告中所有与一致序列不一样的残基全都被加

上了阴影(如下)。

Consensi是一致序列的另外一种图形展示方法,可以用来标志ambiguous残基。另外,序列中一致和不一致的残疾可以用直方图在队列报告中展示。当在某个位置上,任何一个序列的残基与其他序列不一样时,一致序列就会以星号表示。并且用直方图的长短显示其中一致残基的多少。

 从OPTIONS MENU,选择

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 64 -

New Consensus打开右边的对话框。

 在题目框中,输入诸如“All sequences matching potato.”的

名字。

 下面有4个下拉菜单。在第一个菜单选择Potato Calmodulin。其

他的菜单不变:When all match; the template residue 和 show the template residue。

 在右边框“otherwise show,”中输入星号(*)。  选定“Strength.”框。

 单击同意,就把

新的一致性设定应用于打开的队列报告了。  最终的报告如左

图显示。彩色直

方图可以显示新的一致序列的强度。

保存MegAlign文件

 从文件菜单,选保存。  确定文件夹的保存位置。

 在文件名框(视窗)或名字框(苹果计算机)中给序列命名。  单击保存(苹果计算机)或同意(视窗)。  对队列和队列报告的变化都被保存了。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 65 -

从PrimerSelect开始 PrimerSelect能够帮助你设计PCR,测序和交杂实验所使用的引物和探针。输入你的DNA,RNA或反向翻译的蛋白质模板序列后,PrimerSelect就可以在pentamer窗口计算序列的融解温度,自由能和末端自由能。您可以通过控制包括引物浓度、盐分和.G计算温度等参数来限定计算结果。

在模板处理后,PrimerSelect按照用户定义的参数确定引物的位置,并给引物评分,然后筛选出模板序列上的最佳引物序列。引物“workbenches”允许你修改你的引物,检查参数编辑对翻译读框,二级结构,错误的引物位置和限制性酶切位点的影响。如果你选择并优化了你的引物,PrimerSelect可以让你建立有关模板,引物,扩增的文件。和全部Lasergene的应用程序一样,PrimerSelect也提供整合的BLAST查找功能。

如果在使用这软件中需要帮助,可以和DNASTAR联络。电话:(608)258-7420,传真:(608)258-7439,电子信件:,或者经.

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 66 -

内容 创建PrimerSelect文件 67 定义引物特点 68 查找引物对 69 浏览其他的引物信息 按特征对引物分类 引物长度改变 在引物中引入突变 设计新引物 使用寡核苷酸订购表格 保存PrimerSelect文件

70 71 72 73 74 75 76

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 67 -

创建PrimerSelect文件

我们将以克隆载体pBR322为模板DNA序列。在这一节中,我们选择引物,用来扩增位于2013-2169位的H-strand Y effector。首先我们从打开模板序列开始。

 从文件菜单选择New创建一个PrimerSelect文件。

 从文件菜单,选择输入序列(Enter Sequence)。打开下面的对

话框。  从

Demo

Sequences”选中pbr322.seq(视窗口)的文件,或者PBR322

(苹果计算机),单击Add添加序列到右面的窗口。然后点击Done打开序列。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 68 -

定义引物特点和位置

下面我们开始确定引物的类型。

 从条件菜单(CONDITIONS MENU),选择Primer

Characteristics打开左面的对话框。这对话框可以用来设定各种参数诸如:引物长度、最大的3’pentamer稳定性和可接受的重叠。注意默认的引物长度为17-24 bp,并且1

或2 bp的二聚体和发卡样重叠示可以接受的。  不改变默认设定和单击Cancel退出。

 从条件菜单,选择Primer Locations打开右边对话框。这个对话

框允许我们根据给的序列的长度来限制引物的位置。

 从下拉菜单的

Restrict Locations

中选择Upper and Lower Primer Ranges。当在全序列中设计编码区的PCR引物时,这是最好的选择。

 在Upper Primer Locations右面的方框中输入1700和1950。

在Lower Primer Locations右面的方框中输入2250和2500。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 69 -

 单击同意,会出现下面的窗口。成对的绿色和红色的三角形分别标

记所设定的正向和反向引物的范围。

寻找引物对

现在我们已经指定什么种类的引物对是

可接受的,剩下的工作就是让PrimerSelect为我们寻找理想的引物对。  从LOCATE MENU选择PCR Primer Pairs。打开一个二分窗口,

上面窗口中显示计算机寻找到的28对理想引物对,引物对按照评分值依次排列。因为调色板工具中的Alternate Pairs被默认激活 (在窗口左面工具中),所以底部窗口显示的是上面窗口选定的引物对的替代引物对一览表。

 通过拖动在窗口的右侧上的小环拉开建议窗口,可以查看

PrimerSelect对选定引物的建议。

注意现在的“Best choice.”是PrimerSelect根据在最初的条件中设定的参数计算得到的。看下面的窗口,PrimerSelect列出了“Best choice”引物对的25替代选择。这些替代的引物对扩增的区域和上面选定的引物一样,所不同的是他们的序列有些不一样。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 70 -

 选择调色板工具中的Alternate Products(左侧

工具底部),下面窗口显示引物的位置和可能错配

的位置,以及相应的产物长度。左面的那个单一的粗黑棒提示用我们“Best choice”引物进行反应,会有大量产物被扩增出来。如果没有多个5’或者3’引物箭头也提示这一对引物没有错配点。  单击上面窗口里引物对,

观察下面窗口里的产品棒变得越来越细表示预期的扩增物也越来越少。

注意有8个引物对有错误的配对点,用粉红色或淡绿色箭头指示出来。第13对和第22对正向引物有错配点(右边显示),就会用第二条产品棒的表示错误的产品大小。

查看引物的其他信息

PrimerSelect能预测引物形成self-dimers, pair-dimers and hairpins的可能性。

 单击选定“Best choice”引物。  从报告菜单(REPORT MENU),

选Amplification Summary,打开左面的窗口。显示用所选个引物做PCR扩增反应的报告。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 71 -

 选择Composition

Summary,打开右面的窗口,描述扩增区和引物对的碱基组成。

 从报告菜单,选择Self Dimers,Pair Dimers和/或Hairpins

打开新窗口显示每种二级结构的预测结果。Self-Dimer形成窗口如右。

按照引物特点分类

PrimerSelect在自动将引物按照从好到坏的顺序分类以前,已经计算了引物的各个特点。Located Primers & Probes窗口是我们能够根据引物的不同特点,如引物位置、长度、溶解点或自由能等,来对引物进行分类。这里让我们用溶解点来分类引物。

 从报告菜单,选择Located

Primers & Probes打开左面的窗口。窗口显示符合我们标准的引物的一览表。在没有特别指定的情况下,引物按照位置排列。

 从LOCATE MENU选择Sort Primers打开下边对话框。  保留对正向和反向引物的选定,去除对By Position的选定。选定

By Tm Nearest方框,输入65。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 72 -

 单击同意,现在两个窗

口里的引物按照融解温度离65oC最近的程度依次排列。

改变引物长度

PrimerSelect’s工作台允许你在引物中引入限制性酶切位点,突变,改变使用的密码子,核查引物二级结构,查找错配点。在这一节中,我们将用正向引物工作台来扩展我们的引物长度。  双击选定正向“Best choice”引物。

 从编辑菜单,选择Work on Upper Primer打开下面的窗口。  确认Dimer,Hairpin和Priming Sites调色板工具(窗口左侧从

顶端起的4-6)已经激活。

让我们仔细查看一下工作台。在窗口下边的第3排可以看见引物序列。序列两端的三角形“handles”允许你缩短或者延长序列。在窗口的左上角的标题告诉我们引物的长度是23核苷酸,溶解温度为65.5度;而底部窗口的绿色棒显示引物在序列上的大概位置。下面的信息告诉我们没有

大于2 bp的二聚体形成,并且引物只能形成一个并不理想的发卡样结

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 73 -

构。拖动窗口左边的滚动条之间的黑框调整上下窗口的比例。  拖动引物左上黑三角形直到长度延伸到33核苷酸。

现在引物的长度已经显示在窗口的标题中。引物的溶解温度也增加到78.6度,将难以进行PCR。看下面的窗口有二聚体和发卡形成,并标记(坏!)。由于长引物容易形成稳定的二聚体和发卡样结构,所以我们设计的引物经常较短。

 再一次拖三角直到引物最初的23核苷酸。窗口又和我们开始打开

它的时候一样了。

引物中引入突变

PrimerSelect工作台可以很容易的在引物中引入突变。我们“Best choice”的正向引物序列只编码一个苯丙氨酸。在这一节中,我们把读

框1的苯丙氨酸通过改变读框中的密码子转换成苏氨酸。转换完成后我们将可以观察到我们变化的效果。

 点击引物下面,读框1中绿色的苯丙氨

酸,会出现一个小盒子(如右)。盒子中显示全部4种可能的苯丙氨酸密码子和词“Other.”标记的GCC是这个苯丙氨酸残基的密码子。

 选择Other会自动跳出一个子菜单,其中显示所有的氨基酸及其代

号,在“T-Threonine.”上点击一下,模板序列上的碱基组成没有

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 74 -

改变,但是引物序列和其编码的氨基酸(Thr-Ala)发生了改变。 Thr显示为红色,表明它是从最初的引物序列上突变得到的。查看屏幕底部的左角,可以看到引物形成了一个稳定的二聚体。我们可以通过给我们的Thr残基做沉寂突变来删除这个不受欢迎的二聚体。我们试着把苏氨酸的密码子改变为ACC。这个密码子与苯丙氨酸密码子(GCC)只有一个核苷酸不同。

 单击红的Thr残基,从菜单中选ACC代替现在的ACT。 下面的窗口显示从G到A的单一的核苷酸变化去除了二聚体。另外,正向引物的融解点已经从65.5减少了到53.7。也许正向引物新的溶解温度可以与反向引物匹配,但是我们可以找到与之更相匹配的反向引物。

 在工作台的右上的白色文框输入突变引物的名字。  点击窗口左侧顶端的OK钮,保存突变的引物。

 从LOCATE MENU中选择PCR Primer Pairs更新窗口。新的引

物对会加入窗口中,突变的正向引物用淡绿色的箭头表示。  打开建议帘。没有警告的第一个突变引物对是从顶端起的第11个。

这一引物对被评定为“OK”,如果我们必须使用突变引物的话,虽然用它扩增的产品数量不多,但是它却是我们最好的选择。

设计新引物

当你初次打开PrimerSelect的时候,引物目录是空的。如果你愿意,你可以用这个目录来储备任何在PrimerSelect中设计或者被修改的引

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 75 -

物。LOCATE MENU中的Only Cataloged Primers指令可以让你在已经储存地引物中选择合适的引物供使用。在这一节中,我们学习如何设计引物并将他们输入目录表的方法。

 从LOG MENU选择Primer Catalog打开引物目录表。注意到我

们突变的正向引物已经在目录表中。引物左面的检测标志表明引物处于激活状态,V形臂章(>>)(视窗)或子弹(苹果计算机)显示它已经通过了最初二级结构检测。

 按回车键创建一个新的引物区。输入“Test Primer”。  按Tab键。

 输入“GIANTCATSNABMANYWARYRATS”。  按Tab键。

 输入“Contains 46%

ambiguous bases”。  按回车键结束。引物目录

表应该如右图。

如果我们的引物已经通过了最初二级结构检测,则引物左侧出现V形臂章或枪弹。现在没有V形臂章或枪弹,说明我们引物测试失败。让我们核查为什么:

 从报告菜单,选Primer Self Dimer,可以看出该引物可以形成12

对稳定的二聚体。

 从报告菜单,选Primer Hairpins,可以看出该引物也可以形成5

个稳定的发卡。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 76 -

如同我们预测的那样,我们序列里的模糊碱基的百分比过高会使得它那以用来进行PCR反应。

使用寡核苷酸订购表

PrimerSelect提供两种寡核苷酸订购表:Generic 和 IDT (Integrated

Data

Technologies, Inc.)。  点击选定正向“Best

choice”引物。  从LOG MENU选择

Oligo Request Form中的IDT打开IDT寡核苷酸订购表(如右)。我们反向和正向引物序列自动输入表格。如果我们想定购引物,我们只需填表打印,然后传真或用电子信件邮给页底部的地址即可。

 从文件菜单,在返回附近到坐落的引物一对窗口口做选择。

PrimerSelect文件保存

 从文件菜单,选保存。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 77 -

 选定文件的保存位置,命名。

 单击保存(苹果计算机)或同意(视窗)。任何对引物,或者引物

目录表的操作都将和文件一起被保存。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h- 78 -

从Protean开始 Protean可以使用多种方法分析、预测蛋白质结构,并以图形化的方式展示出来。预测蛋白质结构。各类方法按照科学概念进行分类。几个方法可以同时存在于一个概念群中,如用于分析疏水性概念的方法就有好几种,不过有的概念只有一种方法可供选择,如柔韧性。你可以按照任何顺序在Protean文件上展示各种方法计算的结果。另外,Protean可以输入来自蛋白质数据库中标注序列特点,而且允许你注释新特点。和其他Lasergene应用程序一样,Protean也提供整合的BLAST查找功能。

如果在使用这软件中需要帮助,可以和DNASTAR联络。电话:(608)258-7420,传真:(608)258-7439,电子信件:,或者经.

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 79 -

内容 创建蛋白质分析文件 80 Protean’s蛋白质分析方法 80 应用分析方法 82 方法参数改变 优化结果显示 使用蛋白酶消化与SDS PAGE Feature注释 BLAST检索 二级结构模拟 展示滴定曲线 保存分析文件 L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

83 84 85 85 85 86 87 88

- 80 -

创建蛋白质分析文件

这一节,我们将为人的钙调蛋白序列创建一个新Protean分析文件。  从文件菜单选择New打开右面的

对话框,然后打开名为“Demo Sequences.”的文件夹。  双击“Human Calmodulin” (或

“Human Calmodulin.pro”),这样就打开下面的分析文件窗口:

Protean’s蛋白质分析方法

打开序列后就是选择应用方法。方法结果的图形显示可以帮助你选择感兴趣序列的特点。对于我们打开的序列,你会发现只有下面方法中的几

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 81 -

个被展示出来了,下列方法都可以使用:  Title——给文件取名。  Ruler——给文件加标尺。  Sequence——显示序列。

 Protease Map——识别序列上的蛋白酶酶切位点,并且显示酶切

图谱。

 Patterns-Prosite数据库——在Prosite数据库中检索你的序列。  Patterns-Ariadne文件——在序列上寻找用户指定的Patterns。  电荷密度——电荷——预测电荷在特定的序列范围上的分布。  二级结构——Coiled Coil——预测跨膜区的阿尔法螺旋。  二级结构——Garnier-Robson——计算特定氨基酸残基在特定

结构内部的可能性。

 二级结构——Deleage-Roux——蛋白质的二级结构类型预测。  二级结构——Chou-Fasman——通过序列氨基酸残基的晶体结

构来预测蛋白质二级结构。

 Hydropathy-Goldman-Engleman-Steitz-预测可以跨过细

胞膜的非极性阿尔法螺旋。

 Hydropathy-Kyte-Doolittle——根据序列的氨基酸组成预测

蛋白质的疏水区和亲水区。

 Hydropathy-Hopp-Woods-通过计算蛋白质序列上的最大局

部亲水性寻找蛋白质的抗原决定簇。

 Antigenicity-Sette MHC Motifs——预测短肽上与老鼠MHC

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 82 -

II d型蛋白质相互作用的抗原位点。

 Antigenicity-AMPHI-根据序列预测免疫优势辅助性T淋巴细

胞抗原位点。

 Antigenicity-Rothbard-Taylor-预测含有特定基序(motif)

的潜在T淋巴细胞抗原决定簇。

 Antigenicity-Jameson-Wolf-通过联合现有的蛋白质结构预

测方法预测潜在的蛋白质抗原决定簇。

 Amphiphilicity-Eisenberg-预测Eisenberg Moment。  表面可能性——Emini——预测特定区域位于蛋白质的表面的可能

性。

 柔韧性-Karplus-Schulz-预测蛋白质骨架区的柔韧性。

分析方法应用

应用新Protean方法的步骤是:把所用方法从More Methods菜单移入方法帘,然后拖入分析窗口,基本上与前面介绍的GeneQuest方法相同。在这一节中,我们将练习使用Deleage & Roux分析方法预测蛋白质结构。

 从分析菜单(ANALYSIS MENU)选择Show Available,或拖动

分析窗口左上的小环打开方法帘。方法帘中包括了全部已用于分析你的序列的方法。

 你会发现Deleage & Roux方法并不在其中。从方法帘的顶端,点

击More Methods打开下面的子菜单,里面有所有可以使用的方

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 83 -

法。从Secondary Structure的子菜单中单击Deleage & Roux,这样Deleage & Roux就进入方法帘。

 单击方法左边的三角形打开方法如右,如果有数字挨着图标,说明

该方法已经被用于分析,否则没有被用于序列分析,数字的多少代表方法正在被使用的次数。由于我们还没有把Deleage & Roux用于序列分析,所以其左侧没有数字。

 点击方法左边的空白区域去除对方法的选择。然后单击“Alpha,

Regions,”,并将它拖入分析窗口。预测的蛋白质阿尔法螺旋区域即展示在分析窗口中。

改变方法参数

下面我们改变Deleage & Roux方法的参数,然后看一看参数改变前后这个方法预测的结果有什末不同。

 重复上述操作将另一个Deleage & Roux方法应用于分析窗口,并

将两个Deleage & Roux放在一起。可以看出现在有两个完全相同的预测结果。

 双击其中一个会打开一个参数对话框,选择A + B,单击同意。此

时在分析窗口上,相应的区域由于计算参数的改变立即发生相应变

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 84 -

化。

现在你可以比较两个参数计算结果的差别。(注:此时,如果你把最初的方法再用于分析窗口,则改变的参数自动应用于新加入的方法。)

优化结果显示(与GeneQuest相似,这里省略)

使用蛋白酶消化与SDS PAGE电泳

Protean可以识别蛋白序列上的蛋白酶酶切位点,并将酶切片段的电泳结果以图形展示出来。

 从More Methods菜单中将Protease-Protease Map方法移动

到方法帘。

 单击挨着方法名字的蓝色三角形查看蛋白酶一览表。点击方法左边

的空白区域去除对蛋白酶的选择。  选

“Chymotrypsin”和“CNBr.”,将它们拖入分析窗口。 两种蛋白酶的识别位点显示如右。现在至少一种蛋

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 85 -

白酶被应用,我们可以模拟凝胶分离。  单击调色板工具中的范围选择器

(Range Selector)(箭图标)去除对应用的蛋白酶方法的选择。  从SITES & FEATURES 菜单,选择

SDS PAGE Gel Simulation。酶切片段的分离结果会自动显示出来(如右)。在每个上面凝胶柱对应蛋白酶的名字和分子量。

 当光标在凝胶上面移动时,你可以随时查看到相应位置的蛋白质分

子量。移动光标到任何片段上。窗口最上边的标题显示片段的范围,大小,分子量,等电点和HPLC滞留时间。

 为了继续一节,关上SDS PAGE Gel Simulation窗口。

Features注释(与GeneQuest中讲解的相似,这里从略)

进行BLAST检索

Protean允许你通过因特网或企业内部互联网进行序列数据库检索。 在这一节中,我们将在NCBI的BLAST服务器上检索与人的钙调蛋白序列相似的序列。注意电脑必须与因特网相连接,否则,跳过这一的部分,继续下一部分。

 单击调色板工具中的范围选择器(箭图标),在序列上选择你想进

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 86 -

行检索的部分。由于我们的序列比较短,所以我们选择全序列进行比较。

 从EDIT MENU选择Select All。

 从网络检索菜单,选择BLAST查找。BLAST对话框出现(如左),

默认的数据库是nr。  单击同意开始查找。 BLAST结果显示为一个二分

窗口(如下,结构、内容与相关操作参见GeneQuestBLAST结果)。

现在我们选择三个

BLAST序列,在Protean中打开他们。  在BLAST结果窗中选择一个结果。

 单击Create Document,保

存对话框窗打开(如左)。从保存的下拉菜单选择Next(默

认为Selected)。

 在“Sequences.”的左边文本框输入数字“3”。

 单击同意,打开三个新的选定序列的Protean的分析文件。 现在关上BLAST结果窗。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 87 -

二级结构模拟

Protean能够展示诸如螺旋轮,螺旋网和beta片层等基本元件的二级结构。另外, 它能以线性的space-fill样模型或者化学公式样模型展示蛋白质序列。在这一节中,我们做一个阿尔法区域的螺旋轮二级结构。二级结构Garnier-Robson方法已经应用于我们序列,阿尔法螺旋也已展示出来。选定其中的一个阿尔法区域后,我们就能以螺旋轮展示其二级结构。

 单击调色板工具中的范围选择器(箭图标)。

 点击Protean文件最上边的Garnier-Robson分析结果中的一个

阿尔法区域。

 从分析菜单,选择Model

Structures

中的

Helical

Wheel,就会出现左边的二级结构预测图。

为继续这一节,关上螺旋轮窗口。

展示滴定曲线

下面,我们将查看全蛋白质序列的滴定曲线。  单击Protean’s调色板工

具右边的白色空间。这使得选择回到起始位置,如果没

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 88 -

有选中的序列,在绘制滴定曲线时,Protean就会默认是对全序列进行计算。

 从分析菜单,选择Titration Curve。

 打开序列的滴定曲线窗口(如上)。Protean会在等电点处加一个

蓝色的“crosshairs”,以显示pH和所带电荷。

保存分析的文件(略)。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 89 -

从SeqMan II开始 SeqMan II不仅仅能够将成千上万个序列装配成contigs,而且在装配前,可以修整质量差的序列以及从你的序列中清除污染数据,还提供完善的编辑和输出功能。SeqMan II可以使用DNASTAR独特的跟踪(trace)品质评价策略,通过对自动测序仪产生的跟踪数据进行评价,自动生成最精确的一致序列。

装配过程从序列输入开始,输入的序列可以是自动测序仪输出的、也可以是文本格式或DNASTAR序列格式。另外, 你可以从因特网的Entrez或BLAST服务器输入序列。使用Preassembly options中的命令可以进行包括修整质量差的数据,除掉特定的载体或污染序列等操作。你甚至可以在装配过程中选择最后加入重复序列。

Contigs装配完毕后,Strategy View可以用图形化的方式展示contig的范围和质量,并提示你什么地方需要补充序列。在需要的情况下,你可以加入更多的序列,或其他的SeqMan II文件对现有的结果进行再装配。Alignment View 允许你编辑,修整连续的一致序列,找回以前修整过的数据,调整队列(alignments)结果。另外, 你可以查看每一个或所有序列的质量评分。SeqMan II为你提供自动或手动工具,帮助你选择是否加入多个contigs。和其他Lasergene应用程序一样,SeqMan II也提供整合的BLAST查找功能。

如果在使用这软件中需要帮助,可以和DNASTAR联络。(联系方式同上)

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 90 -

内容 输入序列片段 91 Pre-Assembly Options操作 92 检查修整的数据 93 序列装配 查看范围和构建结果 去除矛盾碱基和缺口 手动修改序列末端 文件保存与序列输出

94 95 96 97 98

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 91 -

输入序列片段

我们将从打开“Demo Seqman”文件夹中的14样品序列开始。每个序列都是自动测序仪(PE Applied Biosystems, Inc.)输出的文件格式(*.trace)。

 从文件菜单,选择New打开Unassembled Sequences窗口和一

个空的未命名Project Summary窗口。Project Summary窗口在你装配序列之前始终是空的。

 从Sequences菜单选择Add打开Enter Sequences对话框(如

右)。

 打开“Demo Seqman.”文件夹会出现14个序列。这些就是我们

将要装配的序列。  把片段序列通过把Add

All按钮移到右边的窗口。现在14序列名字应该出现于右边的窗口中。单击Done按钮。

 Unassembled Sequences窗口现在会出现这14个序列。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 92 -

 通过拖拽其窗口右下角展开窗口,直到你能同时看全部样品名字。

Pre-Assembly Options操作

在装配前面,你可以考虑进行两三个装配前的选择。你可以从你的片段中除掉载体和污染序列,优装配顺序,设定片段末端和标记重复序列。在这一节中,我们将从样品中自动除掉Janus载体序列并修整序列末端。

 选定全部14个序列。

 在窗口右上的下拉菜单中选择

“Janus”作为SeqMan I要寻找的载体。

 点击窗口上边的Trim Ends按钮

打开右边的对话框。你将注意到在

没有特别指定的情况下,SeqMan II将用适中的严谨度进行末端修整。不改变设定退出对话框。

 单击窗口右上的Options按钮。打开下面的对话框,显示全部装配

前的选择一览表。默认设定显示扫描载体,实行序列末端修整,使用最适当的序列装配顺序。

 单击Scan All。报告窗口

将出现,但是现在可以放到一旁。在扫描后,你将注意到

Unassembled

Sequences窗口的2中心

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 93 -

专栏发生了变化。现在载体栏显示:载体名字前都有一个检测通过的标志,说明Janus载体在全部14序列中都已经检测到了。limits栏展示新的序列末端,说明载体序列已经去除,末端修整已经完成。

查看修整的数据

现在我们可以查看在扫描完成的末端修整和载体序列去除的细节报告。

 从

PROJECT

MENU,选Trim Report打开左边的窗口,窗口中显示:末端修整的参数、每个序列的名字,平均质量,被修整的数量

以及修整前和修整的序列长度。  在你查看完报告之后,关上它。

要查看SeqMan的修整结果,让我们查看休整后序列的跟踪数据。  从

Unassembled

Sequences窗口,双击打开8号样本,打开右

的窗

chromatogram口。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 94 -

从5’末端起变淡的部分将不会用于序列装配。注意大部分序列修整部分优化后的质量。之所以从这里去除,是因为这些变淡的序列是Janus载体序列。

垂直的黑的棒出现于修整和未修整的序列之间。你可以根据需要拖动黑棒调整用于装配的序列末端。

下面,让我们查看一下序列的5’末端:  单击一致序列的任何地方。

 从编辑菜单,选择Go To Position。  在位置文本框输入“500”。  单击同意。

注意到最好的质量落到这区域上,SeqMan II认为507位以外的序列质量低于中等水平。

 检查完跟踪数据后,关上那个窗口。

序列装配

现在我们准备调用序列装配程序。

 单击Unassembled Sequences窗口左上的装配按钮。

Unassembled Sequences窗口立即消失,报告窗口显示装配的进度。装配完整之后,出现左边的窗口,窗口上边为装配好的一致序列,窗口下边为所有连续的序列。在我

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 95 -

们例子中,SeqMan II将14个序列装配成为单一的contig。

查看覆盖面和构建结果

现在我们已经将所有的片段装配成一个序列,下面我们用Strategy View查看一下其中的矛盾碱基的数量和序列的覆盖程度。这个窗口图形化的显示了每个片段在contig中位置和方向。  单击Project window中的contig。  从CONTIG

菜单,选择Strategy View打开右边的窗口。注意标尺下面

的那条带,显示学的覆盖程度。

条带的颜色和厚度代表覆盖序列的数量。你会看到在大致200-900之间有绿色的较厚条带。这表示两条链都被测序,且高于最小覆盖面临界值的区域。(覆盖面临界值可以通过

PROJECT

MENU-Parameters-Strategy Viewing来改变)。中间的蓝线表示只有一条链被测序的区域。。出现于contig两边的细红线表示这个区域只测过一次序。

 选定窗口左上的Conflicts box可以查看片段序列间的一致程度方

型图。方型图大部分为黑色表示只有很少或没有矛盾碱基。蓝色条

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 96 -

带表示矛盾碱基约为10-20%的区域。

 点击窗口左侧调色板工具中的Zoom In(放大镜图标“+“)。  双击135位碱基调入该区域的Alignment View。样品9中的矛

盾碱基用红色表示出来。  关上Alignment窗口。

去除矛盾碱基和缺口

我们样品序列能够整齐地组装成单一的contig是因为SeqMan II除掉了质量差的和载体数据。在一些情况下,为了获得满意的一致序列,必须去除矛盾碱基和缺口。我们将尝试在Alignment View 中编辑我们的序列。

 从CONTIG菜单,选Alignment View ,打开Alignment View

窗口,上边为一致序列,下边为连续的序列。

 从编辑菜单,选Find Conflict,然后点击Find Next。光标将迅

速跳到102位。单击底部的Find Next按钮(>>),光标跳到306位。样品7在这这个位置右一个“T”,而全部其他的样品都是缺口。我们可以通过查看样品7的跟踪数据去除这个矛盾碱基。  选定样品7的302~310

区域。

 单击样品7名字左边的灰

色的三角形,则显示出其跟踪数据,出现右面的

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 97 -

Alignment View窗口。

 点击Zoom In查看chromatogram细节。

跟踪数据表明样品7里的“T”与其左边的“A”一样可能是人工造成。 从一致序列可以看出SeqMan II’s的trace品质评价标准自动忽略了这些可疑的碱基。因此没有必要手工删除这些碱基。不过从学习的目的出发,我们将用缺口替换“T”,并从一致序列中除掉缺口栏。  选定“T”,输入缺口(连字符)替换它。

 单击一致序列的任何地方,接着从编辑菜单,选Remove

Consensus Gaps,306位的所有缺口都不见了。或者你也可以选定一致序列里的缺口,按退格键(视窗口)或删除键(苹果计算机)即可。

手动修改序列末端

在装配我们的dcontig之前,SeqManII可以根据trace数据的质量和Janus载体序列自动的进行末端修整。虽然有足够的数据可以用来把序列装配成单一的contig,但是也会存在这样的情况,即当我们找回修整过的数据时,SeqMan II可以在单一的contig中加入多个contigs。在这一节中,我们将学习从已经打开着的Alignment View 用手工找回修整过的末端的方法。

为了区分修整过和没有修整过的数据,我们给修整过的数据加一个有颜

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 98 -

色的背景。

 从PROJECT MENU,选参数中的Editing & Color打开左边的对

话框。

 确认Use Weight Color已经被选用,然后单击同意。你用手工找

回修整去掉的数据时,你会发现这些找回的序列有明亮的黄色的背景出现。

如果修整完毕,则Alignment View 中在序列的左边会有一个黑色的垂直棒,右边有一个小的黑三角形。这一节,你可以选14个序列的某一个。

 要找回修整去掉的序列末端,只需把垂直棒向序列的两端拖动即可,

可以看见以前修整去掉的序列有明亮的黄色背景。当你找回了修整去掉的载体序列时,你会发现即使修整去掉的序列的峰型仍然很好,但是其中也已经有很多碱基(红色显示)与您的一致序列不一样了。在你的文件中不应该留有这样的数据。也

许对组装contigs有用的数据是那些由于序列的峰型质量较差而被修整去掉的那些序列。

 拖动竖线将序列恢复到原来修复的位置。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 99 -

文件保存与序列输出

保存SeqMan II文件:  从文件菜单,选保存。  选择文件保存的位置,命名。

 单击保存,则以上所有操作的结果都保存进文件中了。 只保存一致序列:

 选定Project Summary window, the Alignment View或the

Strategy View中一个或多个contigs。  从CONTIG菜单,选Save

Consensus中的Single File打开右边的对话框。  选择文件保存的位置,命名,

确定保存类型(你可以选择DNASTAR,GenBank或FastA格式中的任何一个)。

 选定All and Add Features,不选Include Gaps。这样就将完整

的一致序列,以及contig构建的相关信息全都保存了,同时去除了一致序列中的所有缺口。  单击保存,保存序列。 输出编辑后的片段序列:

 在Project window中选定你要输出的序列。  从CONTIG菜单,选输出序列。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h

- 100 -

 这个命令与保存一致序列的命令一样,允许你以三种格式保存你的

序列。

L A S E R G E N E f o r W i n d o w s & M a c i n t o s h- 101 -

因篇幅问题不能全部显示,请点此查看更多更全内容

Top