計算機音楽の予備知識

by OOI

序章

 コンピュータを使った自動演奏はMIDI機器の普及に伴って一般的なものになりました。ピコピコした単調な電子音から、PCMやサンプリング音源、ベロシティやテンポの緩急のついた高品質かつ自由度の高い演奏が、かなり手軽にできるようになってきています。

 しかし、コンピュータに自動的に作曲させる、または作曲のサブブレインとして活用するといった使われ方はあまりなされていないようです。(データ入力・編集・演奏のツールは優れたものがありますが………)

 音楽情報は、コンピュータで処理する上で絵画の情報と比べると、デヂタルで扱いやすいはずです。しかし(編集ツールでは両者よい勝負しているとは思いますが)、自動作成といった点で計算機音楽はフラクタル絵画やレイトレーシング絵画に大きく水をあけられています。

 もっと計算機で自動的に作曲すること、あるいは音楽における計算機の積極的活用に興味を持つ人が増え、色々な面白い手法がでてきてもよいのでは、と思っています。

 幸い、最近このての本が結構出版されています。そこで貴方を計算機音楽の世界へといざなうため、その基礎知識について述べたいと思います。

 これを読めば貴方も計算機音楽家。

 

1章

計算機は芸術家たるか?

 世に芸術家は多けれど、天性の芸術家はそれほどいない。かくある人は人柄、風貌、言動などが凡人のそれとちょっと違ったところがあります。

 そういったところが作品に表れるのか、[こんな見方があったのか][この感性は卓越している]とかいったことになります。

 このよい意味での[奇抜]あるいは[はずす][センス・オブ・ワンダー]といった感覚は、落語、漫才、プログレッシブロック(死語)にもみられるように知的活動のひとつと言えます。

 作品が人の常識的感覚から少しずれていて、かつ凡人にも理解可能で知的好奇心がくすぐられるとき、それは優れた作品と言うのでしょう。

 あるいはもっと低次元で[きもちわるいいきもち]とか、[おもしろかなしい]とか、[はらだたねむい]といった生理的快感である場合もあるでしょう。

 しかし、年齢や、知識の度合い、時代を越えて万人に優れた作品であると認められるのは並大抵のことではありません。そんな作品にはある意味で魔力が潜んでいるのでしょう。

 凡人が芸術家たりえないのに、いわんや計算機………おや?、といわれるかもしれません。

 しかし、なんやかんや冷たく言われるエキスパートシステムでさえ、専門知識においては凡人より往々にしてまともな判断を下します。

 天性ということになると計算機は本来汎用であるがゆえにぱっぱらぱーであり、恵まれた資質は持っていないといった反論もありましょう。

 しかし、本誌の読者の多くが所有している計算機は、流行からはずれて隔世の感がある。今の計算機には付いていないこんな機能がある。ある部分だけ訳わかんないほどオーバースペックである。といったものが多いでしょう。

 そんな計算機ほど所有者の思い入れが激しいものです。

 この意味では、すなわち[ずれている]といった点では、芸術家の素質十分です。芸術家の域に達した計算機のオーナーであることは、計算機愛好家の最高の誇りでしょう。

感情について

 人は日常のちょっとしたできごと、会話、あるいは芸術作品に出会ったとき色々な感覚・感情を持ちます。

 この起伏がある程度大きくないと退屈ですし、大きすぎるとノイローゼになったり、長く続くとリミッタやフィルタがかかってちょっとやそっとのことでは動じないようになります。

 感情は定量的には捕らえにくいものであるといえます。

 私は自分の計算機音楽の初期目標を[いかに感情というものをコントロールするか]に置いています。コントロールといっても単に『悲しいとか、嬉しいとか、面白いとかいった感情をどうすれば呼び起こせるか。』ぐらいになると思いますが。

 これは非常にフィードバックしにくい事柄です。測定自体が主観によるもので自動測定できないし、反復測定がきわめてしにくいからです。

 また、最終的に作曲はオープンループの制御とすべきです。なぜなら作曲結果をいちいち良いか悪いか観客に聞かせながら作ることは美しくないからです。

 例えば10の良いモノの中から1つ最高のモノを選ぶことは意味がありますが、100のクズの中から1つ使えるモノを探すことは作曲の場合意味が薄いでしょう。

 すなわちいいものであれば最高のものでなくとも可としてよいと思いますし、100のクズの中から選択させることは目的に沿っていないと考えます。

 ですからガーベージアウトにならないように、どのような音階・リズムのときにどういった感情になるかを人が介在しフィードバックして、あらかじめ学習させなければなりません。

 学習させるのでなければ、対応表みたいなものを作ってやればよいでしょう。(しかしこれは非常に難しく、その道の人が知恵を絞っても無理なことみたいですから、さじを投げる私です。)

 それよりも、「為せばなる」といった感じもある(なぜかしら話題の)ニューロコンピュータで処理をやらせればいいのかもしれません。幸いニューロコンピュータは制御に向いているとのことなので、人の感情を音楽によって制御することは比較的容易にできるかも。(だれか私にデヂタルフィルタの自動設計とニューロコンピュータの学習がどう違うのか教えてください)

 とはいえ、感情と音楽の関係は論理的解明をしなければ計算機音楽に明日はないのであります。 

 

コミュニケーションとしての芸術

 芸術はある人から別の人への情報伝達のひとつと考えられます。芸術家が作品を作る過程はコード、作品は伝送路、鑑賞はデコードと見なせます。これを図で表せば【図1】のようになります。

【図1】
 しかし、生まれながらの芸術家ではない計算機は、観衆にたたかれこづかれしながら作風を確立していかなければなりません。【図2】の通りです。

 ここで観衆は人間でもいいのですが、計算機にシミュレートさせてみるのも興味深いものがあると思います。

 まず計算機の観衆に一般的に優れているといわれる芸術作品を体験させます。音楽の場合は交響曲とか民族音楽とかを聴かせればいいでしょう。

 ところがこの[聴かせる]というのがくせ者で、スコアをいったん入力しなければいけません。フーリエ解析などを行い自動的に計算機が処理可能な楽譜の形にしなければ手間ばかりとられます。

 足りない部分はロジックや、人間の補助入力などで補いながら鑑賞のシミュレートをするほうが実際的でしょう。

 このような半クローズループのシステムで鑑賞の、強いては作曲のノウハウをためていくことになります。

 ハードウエアを工夫して日本放送協会のFM放送を聞かせていれば、そのうち聞けるような曲を作曲するかもしれません。でもリアルタイムで音と楽曲分析をするためにはスーパーコンピュータでなければ無理かなあ。

 話しがそれましたが、媒体が言葉にしろ、芸術作品であるにしろ計算機と人がより高度なコミュニケーションをするのはこれからといったところでしょう。

【図2】

音楽の構造について

 音楽のほとんどのものは、ある程度明確な構造を持っています。リズムは基本パターンの繰り返しが多いですし、ある旋律が繰り返されたり変奏されたりしてまとまりを持った1フレーズとなり………というふうに階層的になっています。フラクタルなどでいう自己相関と関連性があるかもしれません。フラクタルはその自己相関ゆえに複雑、かつまとまりのある図形を呈示し、ある意味でひとつの芸術をなしているといえます。

 確かに音楽も曲のごく一部を聞いて全体の構成を、あるいは次にどういった音、リズム、和音が奏でられるかを、ある程度は予測できるものです。このことは音楽を作曲する上で非常に重要なことと言えます。

 

旋律・メロディについて

 巷でよく聞く曲の旋律はえてしてシンプルで、繰り返しが多く構成も単純です。

 自分でもできそうかな………なんて音符を並べても、どうしたことか陳腐でダサイものしかできません。と思うと、ふといいメロヂィが浮かぶこともあります。

 単純なようで感性にうったえるものは、単純な中にもいろいろな(意図して作ったか、自然に涌きでたかは別にして)トリックがあるみたいです。

 自分でもよくわからないものを分析して、アルゴリズム化しようとはどっこい甘い金太郎飴でありますが、[ぽっきん]と折っているうちに、[こんばんわ][ごきげんよう]といった芸術的境地に至れるかもしれません。

 ある基本的法則で縛れば(例えば IF THEN ルールとか遷移表とか)ある程度はそれらしく聞けるものになるかもね。はっきりいってよくわかんない私でした。

 

2章

音楽の物理現象について

 あらゆる音は、sin波の合成で表すことができます。(フーリエ解析を勉強してね。)

 これらのsin波を基本となる音と倍音として考えることができます。これがはっきりした関係を持っていないときはノイズとして聞こえるか、鐘の音のように音の高さのはっきりしない金属的な響きとして感じます。

 基音と倍音がほぼ整数比を持っているときはある音高を識別できます。倍音の構成比、時間変化を音色として認識します。実際に人はどのように音を聞き分けているかといえば、蝸牛と呼ばれる器官によってそれを行っています。

 鼓膜、耳小骨と伝わってきた振動が、器官内で起こす共鳴の領域をセンスすることによって音を聞き分けています。

 周波数が2倍になれば共鳴域は3.5から4mm移動します。(いわゆる対数の関係です)それ意外にも位相差によって音源の方向を感知できます。

 近接した2音も識別できます。が、この場合は物理的なことからだけでは解明できず、もっと中枢神経のほうで高度な処理を行うことにより可能となるといわれています。この能力は生まれながらのものではなく、学習の成果だそうです。

 

音階

 人はわずかなピッチの差でも識別することができます(約0.5%くらい)。音で芸術作品を作るときは、あらゆる周波数の音を使用してもよいと思いますが、一部の現代音楽と民族音楽、意図せず音痴な人を除いて決まった音程の音を用いて[音楽]が形成されます。

 普通1オクターブ(周波数比で1:2の2音)の間は、5から20くらいの数に分けられます。この分け方は色々あって、今一般的に使われているのは[平均律]と呼ばれる音階です。

 この他に、純正率とかピタゴリアンとかいろいろあります。いっぱいあるという現実は、完璧なものはないということであり、微妙にその聞こえ方が違います。

 要は対数と倍数がなかなか数学的、物理的に相入れないところがあるためです。(ここのところは音楽の参考図書を見てもなかなか分からないものです。筆者も自分で計算してみてはじめていろいろな音階がある理由が実感できました。)

 いろいろある音階の中で最も対数優先なのが平均律です。なぜなら半音の周波数の比が音高にかかわらず一定だからです。(半音は2の12乗根の比率。ゆえに12音を昇れば2倍の1オクターブ)

 半音でも、識別できる音程差の10から20倍の開きを持っています。何故音階が発生したかは興味深いところがあります。

 単純に気持ちのよい音を選んで発展していったのかもしれないですし、狩った動物の角がたまたまそんな音をたてたのかもしれないし。

 それはともかくとして連続した周波数変化の音ではなく、階段状の音を聞いて特別な感情を抱くことは人の音の認識能力に密接に関連しているのでしょう。

 

リズム

 これはやはり心臓とか歩くときのステップと関係あるんでしょうね。赤ちゃんはママのおなかにいるときから耳が聞こえ、心臓の鼓動を聞いて成長します。

 心拍のリズムに近い音を聞かせると赤ちゃんはすやすや眠るといった話しはよく知られています。だいたい心拍より速ければのりのよい曲、あわただしい曲と感じますし、遅い曲はゆったり落ち着いた感じを受けます。

 2拍子が同じような理由で親しみやすい拍子と感じるのでしょう。3拍子はどことなく人工的な感じがします。もし人の心臓が3サイクルだったり3本足だったりしたら、2拍子の方を人工的と感じたかもしれません。

 人は一定不変のリズムを好むかといえばそうともいえず、ある程度の変化があったほうがよい気分になれるものです。1:1.05くらいのときが軽やかな感じがするときもあります。

 関係ないでしょうが、歩くときもだいたい軸足のほうが地面との接地時間が長いそうです。もっとも最近は非常にタイトなリズムが好まれるようですが。(残念ながら私はタテノリ世代ではありません。明らかにリズム音痴です。)

 

和音

 音と音を重ねるとよく調和するものと調和しないもの、不思議な響きをもったもの………いろいろあります。いつも調和ばかりしていてはつまらないし、たまに喧嘩するのも家庭円満の秘訣であります。

 かといって、喧嘩ばかりしていると人生に疲れてしまいそうです。(喧嘩が趣味であるといった人は除く)

 2音の調和度合いはシンクロスコープでリサージュ図形を描かせれば直感的にわかるのですが、こと3音の調和となると厄介であります。

 倍音の関係から調和するかしないかはある程度頭で理解はできるのですが、2音のときには全然感じられなかったある種の感情(嬉しいとか、悲しいとか、厳格な感じとか………)あるいは色彩感といったものが感じられます。

 これについてはいろいろ文献をあさったのですが、納得いく明確な説明はどこにもなかったのであります。

 音の分析処理過程の中で生じるもので、物理的な現象とはあまり関係ないといったところでしょうか。他人の声色からその人の感情を鋭敏に察知するコミュニケーション能力がそうさせているのかもしれません。

 

MEMOLのコンセプト

 私はなんとしても、まともな自動作曲プログラムを作りたいと思っているのでありますが、どんなものができるか作成可能なのかすら、不透明な現実を直視しなければなりません。

 思いたってから3年以上経つのですが、いまだに実験用のサンプルプログラムさえ、数えるほどしかつくっていません。毎日ごはんを食べるためには、一所懸命働かなければならないのであります。

 と、後ろ向きになってしまいがちなのでありますが、ぼーいずびいえんびしゃす、夢は大きく世界征服。

 MEMOL[Meta(physical)-Music-Organic-Logic]のダイアグラムを【図3】に示します。

 うーん。所詮、絵に描いた餅。餅屋は餅屋。ガーベジ イン モチ アウトは夢のまた夢か。(私は昆布の入ったお餅が好きです)

【図3】:MEMOLのダイアグラム
 

3章

よくでる!計算機音楽用語

イリアック組曲

 イリノイ大学で1955年に作曲される。作曲したのは、ILLIAC II(真空管よ)。 発表されたのが1957年で演奏は人の手による。

 私は残念ながら聞いたことがないが、人によれば二度は聞きたくない音楽だそうである。

 弦楽4重奏で4楽章からなり、第1楽章は16世紀の対位法、旋法、禁則よりなる。第2楽章は白鍵盤のみからなる曲で、調和的だが単純な印象の曲。

 第3楽章は乱数を基本としたアバンギャルド的な曲、といっても繰り返し部分が多い。第4楽章は、マルコフ連鎖、和声とリズムの遷移確率表を使用している。

 

乱数・確率

 乱数はでたらめな数の組み合わせであるが、一様にでたらめな場合とある分布を持つものがある。乱数はそのまま曲に使われることは少ないようだが、あるフィルタを通して音に対応づけられたり、曲想などのジェネレータとして使用される場合もある。

 確率は、ある音から次の音あるいは和音、リズムの移り変わりの変量として使われる。ある曲を分析してこれらの遷移確率表を作れば、この表を元にして似た感じの曲を作ることができる。

 

マルコフ連鎖

 ドの次はレかミが来ることが多く、もしドレときたら次はミが来やすい、といったことがあります。このときは音の移り変わりを過去から予測することができます。履歴によって次の確率が変化するといったところ。

 これを用いれば、細かな曲の分析ができる。連鎖の次数を大きくし、それを元に曲をつくると大パクリ大会になってしまう可能性もあるので注意。

 

パレストリーナ

 人名であるが、16世紀の音楽の様式を指すことが多い。7度の跳躍はだめ!並行5度進行はだめ!といったIF THEN 形式で表わせる禁則が明確になっているので、手っ取り早く自動作曲のフィルタとして用いられることもある。

 

1/fゆらぎ

 自然界に多くある特性分布で、まったくのでたらめ(1/f^0)と直前の状態に強く影響されるブラウン運動(1/f^2)の中間である。

 クラシックの名曲もパワースペクトルがおよそ1/fになるとか。音楽は予測できるのとできない状態のちょうど中間がよいといった説明にもよく使われる。

 

フラクタル

 今やグラフィック界ではフラクタル図形があぐらをかいている。確かにその図は美しく単純な法則から導き出されるとは思えないほど美しい。こういったフラクタル的要素を音楽にも取り入れられないかなぁ、と思うのは筆者だけではあるまい。

 自然界には一見無秩序に見えるが、全体を捉えると非常に秩序だった造形が多い。数学はこの無秩序を極力排して発展してきたようにも見える。最近は混沌としたものをも数学で扱うようになってきている。その理論は悲しいかなちょっと理解できそうにない。

 

イアニス・クセナキス

 計算機を使った作曲では第一人者として知られる。現代音楽畑の人である。(現代音楽の作曲家には計算機にやたら強い人が多い)

 自由確率、マルコフ連鎖、ゲーム理論、集合、群論といった数学論理を用いて作曲をしてきている。計算機音楽研究家で、この人を知らないともぐりといわれるので覚えておくように。

 彼のUPICシステムというのはデジタイザで音楽の旋律のデッサンをおこなうようにして作曲する。すぐに音符データに変換してからDA変換にて音にするらしい。マンマシンインターフェースを重視したシステム。OSはiRMX86でCPUが8086とのことだが初期バージョンであり、レベルアップしているのは当然と思われる。

 この前東京に行ったとき彼の[音楽と建築]といった著書を買ってきたけれど案の定さっぱりわからなかった。(余談になるが、かの[MICRO]という雑誌は1984年創刊から5号で廃刊となったが、当時まだそんなに注目を浴びていなかった人工知能、フラクタルといった特集をしっかりやっている。このUPICシステムについては3号で紹介している。ほかにエリック・サティのコンピュータ向き音楽とかシェーンベルグの無調音楽とかモーツァルトのダイスメヌエットとかの紹介記事も他の号にある。今考えても不思議な雑誌である。筆者のまわりにも[MICRO]のファンは多かった。)

 

デヂタルフィルタ

 音符は離散情報であり、デヂタル・フィルタを通して音列を変形(予測)させることもできる。フィルタさえできていれば、ある曲の断片、あるいは任意の音符を入れるとそれらしい曲になることがある。一般には、ある曲からフィルタの係数(複数)を算出して行う。

 似たような曲だと同じに素材にしてもよいが、全く違った内容の曲を素材にしてフィルタを作ると、それなりに支離滅裂になるらしいとのこと。

 意味を持った情報(文章とかプログラムあるいはグラフィックとか)にフィルタをかけて音楽にする方法論もあるだろう。文章情報空間とかプログラム情報空間から音楽情報空間への意味的な線形写像とも考えられる。

 

終章

これであなたも計算機音楽家

 まじめに計算機作曲に取り組んでいる人はその道ではかなりいるが、巷ではまだそれほどいない。この記事を読まれて、「よし自分も計算機音楽を作ろう」と野心に瞳燃ゆる読者を想像する筆者です。(まず、いないだろうと内心思いつつ)

 そのうち計算機の中でもメジャーな分野となることは間違いないと信じる私であります。