知能情報メディア概論2
(学籍番号 名前 課題番号を書いて提出)


課題番号4(フーリエ変換)

(1)
全ての波形は、様々な正弦波の重ね合わせで表現できる。
この事から、周波数解析という手法が生まれた。
どの周波数の正弦波がどれだけ含まれているかを調べる事で、信号の特徴を捉えられるのである。
具体的には、任意の信号f(t)は、次の式で表す事ができる。

f(t)=(1/(2π))∫∞ -∞ F(ω)exp(jωt)dω

そして、重ね合わせの重みであるF(ω)を求めるのが、フーリエ変換である。
つまり、どの周波数の正弦波がどのくらい含まれているか求める事ができるのである。
このF(ω)を、周波数スペクトルと呼ぶ。
また、|F(ω)|を求めれば、その正弦波の振幅が分かり、位相も、Arg(F(ω))で求める事ができる。

(2)
以下のような応用に、周波数解析は用いられている。

・音声の特徴抽出
この音声が、どの語なのか(”あ”とか”い”とか)を判断するために、
その音声に対して周波数解析を行い、極大値に相当する周波数(フォルマント)
を求め、それを特徴として使用する。
コンピュータには、あらかじめ”あ”などの語を入力し、フォルマントを抽出しておく。
そして、それらのデータベースと、入力された音声のフォルマントを照合する事で、
入力された音声が何なのかを判断する事ができる。

・音声、画像の圧縮
画像をフーリエ変換すると、低い周波数にエネルギーが集中する。
なので、高い周波数成分は無視できる。
それを利用したのが、JPGである。

・周波数多重化通信
一つの伝送路で複数の信号を送るために、周波数多重化FDMという手法を使う。
複数の波形をフーリエ変換し、変調し、異なる中心周波数に各波形を埋め込むのである。

・画像のフィルタ処理
画像に含まれている雑音は高周波成分を多く含んでおり、
また、画像の輪郭部分も、高周波成分を多く含んでいる。
そこで、フーリエ変換を行い、高周波成分を削除し、
フーリエ逆変換を行って戻すと、雑音を消去する事ができる。
逆に、高周波成分のみを取り出すと、輪郭だけを抽出できる。


課題番号7(立体形状表示)

コンピュータで立体形状情報を提示する場合、コンピュータの負荷をなるべく少なくするため、
人間の感性特性を利用した簡略化が行われる。
以下では、その例を示す。

フォングシェーディング。
コンピュータ上では、物体は、ポリゴン(板)の集合で表現される。
したがって、球のような滑らかな物体を表示する場合は、
滑らかに見えるように、多くのポリゴンを使って、曲面を近似しなければならない。
しかし、あまりに多くのポリゴンを使うと、コンピュータの負荷が高くなってしまう。
そこで、フォングシェーディングを利用する。
物体の表面の明るさは、面の法線方向と光源方向との角度(cos)で決まる。
今、二つのポリゴンがあるとする。
この二つは、左斜めと右斜めを向いており、これに光が当たると、
境界がはっきりと出てしまう。
そこで、この二つのポリゴンの各頂点の法線ベクトル(向き)を、
滑らかに変化させてやる(二つのポリゴンのつなぎ目の法線ベクトルを真上方向にする)
事で、影が滑らかに移り変わり、なめらかな曲面らしく見えるようになる。

次に、バンプマッピング。
これは、普通のポリゴンの法線ベクトルの向きに、
ランダムなゆらぎを与えてやる事で、ランダムな影をつけ、
物体にざらざらした感じを与える手法である。

フォースシェーディングは、これを、力覚提示に利用したものである。
力覚提示システムは、コンピュータ上の物体を仮想的に触れるようにするシステムである。
しかし、通常のポリゴンの場合、手に与えられる反力が一定のため、
触った感じが滑らか過ぎて、違和感を感じる。
そこで、反力にランダムなゆらぎを与えてやる事で、
ざらざらした感じを与え、リアルさを増強させるのである。

このように、人間の感性特性を利用した簡略化はとても有用であり、
すでに様々な分野で成果を挙げている。


知能情報メディア概論1
(21世紀の知能情報メディアに関する科学技術に関して、期待するもの)

僕は、知能情報メディアに関する科学技術として、医療関係の技術の発展に最も期待しています。
医療は、誰もが必要な技術であり、それが進歩することは最も重要であると思うからです。
X線で始まった最新の医療技術は、CTでさらに進化しました。これがもたらした恩恵は、計り知れません。
今まで、一方向からしか知ることの出来なかった体の内部ですが、CTによって、断面が見えるようになり、
さらには、3次元的に画像を再構築することまで可能になったのです。
今まで発見できなかった問題も、発見できるようになり、早期治療に貢献しました。
これと同じような進化が、今後、知能情報メディアによる技術で行われるでしょう。
心臓などの、鼓動する器官もCTの高速化や、アルゴリズムの研究によって可能になると思います。
そうすれば、今よりもさらに詳細な患者の状態を知ることができ、確実な治療ができると思います。
後、現在はX線を使っていますが、そうでない光や超音波を使ったセンシング技術にも期待しています。
それが可能になれば、やや危険なX線を使わずにすみ、さらにリアルタイムにセンシングする事も可能になるでしょう。
これもまた、現代社会に多大に貢献すると思います。

医療以外の分野では、自動翻訳にも期待しています。
日本語をしゃべったら、自動的に英語に変わる。人類の長年の夢が叶い、言葉の壁という強固な壁が破られる世界。
それは、決して夢物語ではなくなってきています。
日本語を入力したら、それを一度中間言語として、コンピューターに理解できる形に変換して、その後、英語に翻訳するようにすれば、
中間言語>英語、中間言語>スペイン語なども、日本語>スペイン語などは作らずに、拡張でき、比較的短期間に多数の言語に変換できます。
中間言語として英語を用いるのも、開発コストの面では、有効かもしれません。
現在でも、文字列の翻訳は、かなりのレベルにまで来ています。
これからの課題は、話し言葉など、砕けた表現でも翻訳できることと、音声を入力して文字列にすることです。
しかし、この音声認識が現在の一番の課題です。
方法としては、入力した波形と、データベース化した「あ」などの音声との比較を、周波数分析によってするのですが、
どこからどこまでが一音か判断しないといけませんし、音声の比較にはかなりの処理速度が必要となるので、一筋縄にはいきません。
ですが、今後、研究が進み、さらに、計算機の処理速度も進化していけば、そう遠くないうちに、実現するだろうと思います。
そうすれば、新しい国際化時代が始まることでしょう。