LMT NEW PBS——作业排队管理软件
作业排队管理系统是一个建立在操作系统之上的一类系统软件,以机器、队列、请求作为它的主要资源。其主要作用是强化操作系统的作业管理功能,提供作业即时提交、定期执行、作业调度、作业控制等新机制,以便更加有效地利用系统资源、平衡网络负载、提高系统整体性能。作业管理系统一般具有典型的客户/服务器结构,服务器的功能包括批处理排队、作业调度、作业执行及资源管理等,客户的功能包括作业定义、服务器管理、系统信息查询等。在服务器与客户之间,采用TCP/IP网络连接协议及与平台无关的数据通讯协议。作业管理系统涉及并行编程技术、并行机环境、事务处理、网络协议、数据库系统、网络文件系统等多个技术领域。
LMT NEW PBS--作业排队管理系统是典型的客户/服务器结构,服务端的底层使用NQS (网络队列系统)实现集群计算机系统的负载平衡,使用户最大限度地利用集群计算机系统环境中的各种资源,以提高效率、降低成本;客户端提供完全的GUI用户界面,完成用户作业管理及系统管理功能;使用面向对象的网络协议CORBA(公共对象请求代理结构)实现客户与服务器的通讯;采用集群技术使系统具有高可靠性。LMT NEW PBS作业排队管理系统具有以下主要特点:
l 全面的图形界面
LMT NEW PBS系统的图形操作页面可以完成命令行操作的所有功能,用户可使用LMT NEW PBS系统来创建、管理、投交作业网络;监视作业网络的执行情况,对执行过程中的作业网络进行控制;建立、修改、删除日历;设定作业网络的执行时刻表;并管理整个服务器机群。
l 全局日历调度
LMT NEW PBS系统可灵活地定义日历以驱动作业,用户使用日历定义的图形界面工具,可以建立用户所需要的商业数据处理作业调度。日历包括工作日历、节假日历,可以在日历上定义作业执行的规则;扩展作业的定时执行功能,即允许作业以每分,每时,每天,每周,每月,每年的形式进行提交。
l 支持分布式环境的集中管理功能。
在分布式环境中,跟踪所有的网络服务器和所有的作业是一项繁重的工作,使用LMT NEW PBS,可以用与大型机一样的集中模式来管理整个网络。可监视和管理所有的服务器和作业,可以检查过去、现在和将来的作业调度。
l 作业网络
LMT NEW PBS系统可以建立复杂的作业网络,可将这些作业同日历和事件联系起来,并可以象操纵一个作业一样操纵它们。复杂作业可以视为作业依赖关系的一个扩展,其中包括顺序、并行、分枝、等待事件等多种依赖关系。
l 查看和跟踪工具
LMT NEW PBS可以记录系统的每个事件以备错误恢复,它也记录所有作业的详细信息以供审计。系统提供了相关的工具,可以用来分析、统计相应数据,以帮助用户计划数据处理、计划系统容量、计划系统升级和消除系统瓶颈。
l 具有动态负载平衡的功能
能够充分利用系统资源,防止结点间的负载出现严重不平衡。可以在一个集群范围内通过合理的作业分配,保持各结点负载基本平衡
l UNIX和NT的异构系统集成
LMT NEW PBS为异构的UNIX和NT系统提供了单一的系统映象,UNIX和NT系统可以包含在一个虚拟大型机中,用户可以使用任何一个台式机作为虚拟控制台,来监视和控制整个网络上的数据处理。
LMT NEW PBS作业管理系统的简单介绍:
(作业列表_查看所有作业:显现出作业的详细信息。作业详细信息包括作业文件参数、作业计算结果、作业ID、主文件编号、所需CPU数量、所需内存大小、软件名称、版本等等。)
(作业调整:可以对正在排队的作业进行排队顺序的操作。)
(节点列表:显示所有节点记录。)
(节点维护:显示所有的节点信息,并且可以对节点进行新增、修改、删除操作。)
(节点平台管理:显示出所选节点平台的详细信息,并支持对去进行修改。)
(可用CPU配额管理:显示的是用户空闲时可用上限CPU数、紧张时可用上限CPU数。)
(作业节点实时状态监控图:显示当前实时的节点监控结果。)
(作业数据分析:依据时间范围、软件视图、用户视图、只显示软件、只显示具体队列等方式选择要查询的数据。)
(用户列表:查看用户的角色,系统管理员或提交人员角色。)
(CAE维护:查看到按软件名称排列的列表。该列表显示软件名称、软件版本、软件安装目录、软件程序绝对路径、主文件 后缀名、MPI路径、MPI版本等信息。)
(系统检测:可以对异常情况平台进行立即检测及修复功能操作。支持对平台查看历史日志。)
LMT NEW PBS作业管理系统作为提高生产效率、优化资源利用、提高企业竞争力的一个强有力的产品,现在已稳固占领日本的商业领域,同时在市场上得到越来越广泛的使用。LMT NEW PBS系统主要应用于商业领域如汽车工业、航天航空、银行业、石油化工企业、信息服务业等。该系统具有强大的后台系统来完成企业范围内的作业管理,实现企业人力物力等资源的优化利用,简化系统维护工作,协调企业内各类应用系统的运行。它可跨越多平台进行互操作。具有高效的处理能力,可在网络系统中进行负载平衡,并应用集群技术实现了系统的高可靠性。环境的构造及整个系统的应用都有友好的用户界面作为支持,用户可通过简单的操作实现企业管理。