1.1 邮件的各种协议
电子邮件是一种用电子手段提供信息交换的现代化通讯方式,让人们能够快捷的传递消息,它与传统的信件通信方式相比有着巨大的优势。电子邮件的通信与其他的Telnet和FTP服务不同而是使用了一种称为“存储转发”的一步通信方式,即信息的收发者不需要同时存在,即可实现信息的传递。当前的邮件系统多为TCP/IP电子邮件系统,采取的是端到端的传输方式。在这端到端的需要遵循一定的基本协议和标准,这是保证电子邮件在各种不同的网络和操作环境中能够正确的传输,并且通过对于邮件传输协议的认识和分析,了解邮件实现方式以及邮件数据的格式,才能解析邮件数据,为邮件过滤提供数据支持。其中主要的邮件传输协议有以下三种:
1> SMTP
SMTP[1] 是一种简单的邮件传输协议,属于TCP协议支持的提供可靠且有效电子邮件传输的应用层协议。SMTP 是建立在 TCP上的一种邮件服务,主要用于传输系统之间的邮件信息并提供来信通知。它使用由TCP提供的可靠的数据传输服务把邮件消息从发信人的邮件服务器传送到收信人的邮件服务器。
邮件SMTP发送流程
2> POP
POP(Post Office Protocol,即邮局协议),用于电子邮件的接收,它使用TCP的110端口,现在常用的是第三版 ,所以简称为POP3。POP3仍采用Client/Server工作模式。
3>IMPA
互联网信息访问协议(IMAP)是新一代互联网访问协议,是优于POP的新协议。和POP一样,IMAP也能下载邮件、从服务器中删除邮件或询问是否有新邮件。
1.2 标准邮件结构分析
邮件的头部信息是结构化数据,邮件的内容部分是半结构化数据,虽然各种邮件传输协议有所不同,格式上有部分区别,但总体上遵从一般化的结构,POP3邮件传输协议作为较为完善的邮件协议,具有一定的代表性,因此,本文以一份此格式的邮件分析其结构,邮件头部和内容数据分别是:
Received:邮件传输过程中的服务器添加的传输节点标识,代表着此份邮件的传输路径;
Message-ID:是一份邮件的唯一标识,其由邮件服务器生成添加;
From:表示邮件的产生者
To:邮件的收信人
Subject:邮件主题
Date:邮件创建日期以及时间
Message:邮件的正文内容
X-Mailer:此为扩展字段,表示邮件产生的软件