2クラウドコンピューティング
2.1概要
クラウドコンピューティングは21世紀の世界を支える重要なインフラストラクチャーであるが、突然生まれた新しい単独の技術ではない。多数のサーバの集合をあたかも1つの巨大リソースをもつコンピュータのように扱うことのできる仮想マシン技術や、大量のデータを複数のストレージに分散配置し、並列処理することで必要な都度瞬時に取り出し組み立てることのできる分散処理技術、それらに対応したハードディスクを筆頭とした大容量等、最新のICT技術を集大成し構築した新たなパラダイムということができる。
2.2パブリッククラウド
パブリッククラウドはクラウド提供者が公衆のインターネット網を介して不特定多数の個人ユーザや企業に提供する、企業や組織を外部攻撃から守るファイアウォールの外側に構築されるクラウドサービスである。
• Dropbox
2.3プライベートクラウド
公衆を意味する誰もが使えるパブリッククラウドに対し、プライベートクラウドは文字どおり自社専用のクラウドコンピューティングシステムを構築することであり、利用者は利用できる権限を有する従業員等に限定される。
プライベートなクラウド環境は、利用者自身またはクラウドベンダのデータセンタに自社専用のプライベートなクラウド環境を構築することで可能となる。自社専用の環境を構築することによってコンピュータリソースを自由に利用することができるし、何より自社のプライベートデータがどこにあるかわからない不安や、いつ漏洩するかもわからない不安から解消されるメリットは大きい。
• Openstack
2.4ハイブリッドクラウド
基幹業務などを行う、本来自社内に閉じた専用のプライベートクラウドと、誰もが利用できるオープンなパブリッククラウドとを融合することで、双方の長所をあわせ持つ多機能•多用途型の複合クラウドシステムであり、同一組織内を対象とするオンプロミスな自社固有のプライベートクラウドを外部に開かれたオープンなパブリッククラウドとの融合したハイブリッドなクラウドシステムが実現できる。
3機械学習による分類器
3.1概要
機械学習は,人間が自然に行っている学習能力と同様の機能をコンピュータで実現しようとする技術?手法のことである。センサやデータベースなどからある程度の数のサンプルデータ集合を入力して解析を行い、そのデータから有用な規則、ルール、知識表現、判断基準などを抽出し、アルゴリズムを発展させる。
分类器是一种计算机程序。他的设计目标是在通过自动学习后,可自动将数据分到已知类别。应用在搜索引擎以及各种检索程序中。同时也大量应于数据分析与预测领域。分类器是一种机器学习程序,因此归为人工智能的范畴中。人工智能的多个领域,包括数据挖掘,专家系统,模式识别都用到此类程序。对于分类器,其实质为数学模型。针对模型的不同,目前有多种分支,包括:Bayes分类器,BP神经网络分类器, k近傍法,SVM(支持向量机)算法等。
3.2 k近傍法
k近傍法は目的のわからないデータから、全既知データまでの距離を測る。そして距離の短い順k個で多数決し判断する。k は正の整数で、一般に小さい。k = 1 なら、最近傍のオブジェクトと同じクラスに分類されるだけである。二項分類の場合、k を奇数にすると同票数で分類できなくなる問題を避けることができる。
电影分类的列子。
3.3ナイーブベイズ
3.4 SVM
4関連研究
4.1迷惑メールの研究
4.2 ハイブリッドクラウドの研究
4.3秘密分散に関する研究
5日本語処理ツール
5.1自然言語の処理
5.2形態素解析器 とIPA辞書
文章を意味のある単語に区切り、辞書を利用して品詞や内容を判別すること。かな漢字変換や、機械翻訳などに用いられる。コンピュータによる自然言語処理技術の一つ。
形態素とは、文章の要素のうち、意味を持つ最小の単位である。英語の文“I love you.”では、“I”、“love”、“you”がそれぞれ形態素に当たる。この時、“l”や“o”などのアルファベットは、それのみでは意味を持たないため、形態素とは呼ばない。英語では原則として文章を単語ごとに区切って書く(分かち書き)ため、形態素ごとに分割することは容易である。
一方、日本語では単語ごとに区切らず続けて書くために、形態素ごとの分割が難しい。例えば、かな漢字変換の場合には、ひらがなのみで与えられた文章を区切る必要があるが、これは辞書を引きながら、色々な区切り方を試していくことになる。
この時、辞書にある名詞を形態素として区切ったり、前後の品詞を見て文法的におかしい区切り方は省くなどの処理をするが、複数の解釈が可能な文章もあり、区切り方を一意に決定することはなかなか難しい。特に長文になるほど区切り方の解釈が複雑になるため、ユーザの意図しない漢字変換をしてしまうことが増える。