データベース

2009年2月15日 (日)

ATOK

Justsuite JUST Suite 2009 を購入しました。ワープロは一太郎とWordを使っていますが、IMEだけはずっとATOKです。いままで蓄積した辞書がありますし、辞書を使い分けられるために、それぞれ辞書を使っていますので、なかなか替えられません。

ちなみに、辞書は標準辞書、名詞辞書、漢文辞書、旧漢字辞書、年号辞書、郵便番号辞書、アクセサリ辞書と7つの辞書を使い分けています。

データベースの入力には、名詞辞書を使います。名詞辞書という名付は必ずしも名詞のみではなく、漢字のみ入力できるように、送りかなのつかない品詞のみの辞書としたものです。つまり、独立語、単漢字、固有名詞などに限定しています。

いまでこそ、文語の入力ができるようになりましたが、そのために漢文辞書を作りました。

また、旧漢字のみの辞書を作って、旧漢字をあえて入力したいときに使用するようにしました。

年号辞書は、パソコン通信時代のNfty Serve のJUSTSYSYTEMフォーラムに、投稿したものです。その当時はたしかATOK12で作ったものでしたが、もうDownroadはできないとおもいます。

これは、辞書で年号の変換ができるようにしたものです。

たとえば、”けんちょう2”と入力すると”建長2年(1250)、あるいは1250年(建長2年)など数種類の表現で変換候補がでるというものです。こんなのは、メーカーがオマケに作ってもよさそうなのですが、いまだに作っていないようです。

IMEが替わると辞書の整理をしたくなります。効率よくヒットするには必要なのですが、これをやりだすとますます時間が取られてしまいますので、今回はやらないことにしました。

しかし、こんなに、工夫しているのに、今使っているデータベースのACCESSとはあまり相性がよくありません。IMEのオンオフがうまく機能しないのです。しかたないので、項目にうつるたびにIMEのオンオフをしなければなりません。実にキータッチの回数がふえて非効率です。なんとかならないのでしょうか。

Photo今作業中は、住所の変更作業です。寺社のデータは17000件ほど入っていますが、それを全部チェックするのではなく、とりあえず国宝、重文、都道府県文の所蔵者のみにしています。優先順位をきめてかからないと、効率が悪いので、すこし計画的にやるようにしています。いままでは、まだまだ時間はいくらでもあると思っていましたので、それでもよかったのですが、もうそうもいかない心境です。

Photo_2 ちなみに、モニターの上にあるのは、年号対照表です。年号を西暦に換算するのは、これで充分です。むしろ、これを画面にだすよりもずっと便利です。

Photo_3 これは、地域コード表です。都道府県だけではなく、世界各国のコードもついでに割り振っていますので、代表的な国のみ書いています。

| | コメント (0)

2009年2月 4日 (水)

所在コード

Photo

市町村合併も、もうそろそろ落ち着いてきました。これから、新たに合併する市町村は極端に少なくなるでしょう。それで、寺社の住所録の修正作業をやっと出来るようになりました。データベースの中で、寺院神社等、彫刻作品の所有者のデータベースとして、『寺社テーブル』を作って入力してきましたが、市町村合併で住所を変更しなければならないのです。

いままでは、住所は「所在コード」として、5桁の数字で表してきました。すなわち、最初の2桁は都道府県コードそして、その次の3桁は市町村コードです。このコードは毎年JISで改訂され、新しく市が誕生したとき等は、新たにコードを割り振るのです。これによって、市町村単位での並べ替えができました。

ところが、市町村合併がこれだけ大規模に行われると、新設された市の名を覚えるのに一苦労します。さらに、入力のもとになる文献は当然、合併前の住所で書かれていますので、それを合併後の住所に翻訳しなければならないのです。すると、この新設の市はどの市町村と合併したのかがわからないと翻訳作業ができません。

それで、コード表にもうひとつ新しくコード表をつくることにしました。それは、7桁の数字とし、最初は都道府県コード、つぎの3桁は合併あるいは新設した市町村コード、最後の2桁は合併前の市町村を古い順から、01、02と順番に番号をつけたもの としました。

1522200 新潟県上越市【新設】
1522201 新潟県上越市(旧東頸城郡安塚町)
1522202 新潟県上越市(旧東頸城郡浦川原村)
1522203 新潟県上越市(旧東頸城郡大島村)
1522204 新潟県上越市(旧東頸城郡牧村)
1522205 新潟県上越市(旧中頸城郡柿崎町)
1522206 新潟県上越市(旧中頸城郡大潟町)
1522207 新潟県上越市(旧中頸城郡頸城村)
1522208 新潟県上越市(旧中頸城郡吉川町)
1522209 新潟県上越市(旧中頸城郡中郷村)
1522210 新潟県上越市(旧中頸城郡板倉町)
1522211 新潟県上越市(旧中頸城郡清里村)
1522212 新潟県上越市(旧中頸城郡三和村)
1522213 新潟県上越市(旧西頸城郡名立町)

2900100 奈良県
2920100 奈良県奈良市
2920101 奈良県奈良市(旧添上郡月ヶ瀬村)
2920102 奈良県奈良市(旧山辺郡都祁村)
2920110 奈良県奈良市<東大寺>
2920120 奈良県奈良市<興福寺>
2920130 奈良県奈良市<元興寺>
2920140 奈良県奈良市<薬師寺>
2920150 奈良県奈良市<唐招提寺>
2920160 奈良県奈良市<西大寺>
2920161 奈良県奈良市<新薬師寺>
2920162 奈良県奈良市<正倉院>
2920163 奈良県奈良市<秋篠寺>
2920164 奈良県奈良市<白毫寺>
2920165 奈良県奈良市<不退寺>
2920166 奈良県奈良市<法華寺>
2920167 奈良県奈良市<般若寺>
2920168 奈良県奈良市<海龍王寺>
2920169 奈良県奈良市<円成寺>
2920170 奈良県奈良市<大安寺>
2920171 奈良県奈良市<奈良国立博物館>

有名な寺院は末尾2桁の番号を10番台から適宜つけておくと、並べ替えのとき、おおよそのグループ別ができるようになります。

この「所在コード」による並べ替えはあくまでも、市町村単位でグループ別にするにすぎません。それ以上の並べ替えはできないのです。しかし、奈良市の場合のように、寺院のコードをつけておくと、作品でも、文献でも、ある程度グループ別ができるので、あとで、手作業で修正するにしても、やりやすくなります。

コンピューターですべて完ぺきに作業をしようとすると、大変な労力と時間を必要とします。しかし、こんな程度の並べ替えでよしとすれば、多少見にくいのを我慢すれば、それはそれで便利なものなのです。

コンピューターとの付き合い方では、こんなアバウトさが一番ストレスがかからないとおもいます。

(注)写真は新橋駅の地下階段の壁にあるステンドグラス

| | コメント (0)

2009年1月 9日 (金)

時代区分

表6 時代区分

大時代 西暦 時代区分 時代名・様式
古代 BC - 538 先史・古墳時代 上古、石器、金石、古墳、縄文、弥生、上代、太古
古代 538 - 794 飛鳥・奈良時代 推古(593-628)、飛鳥朝・飛鳥(538-663,671)、飛鳥後期(645-675)、奈良時代・奈良朝(645-794)、奈良前期・白鳳時代(645-710)、奈良後期・天平(710-794)
古代 794 - 969 平安時代前期 弘仁時代、弘仁貞観時代、藤原時代、平安朝
古代 969 - 1185 平安時代後期 藤原、王朝、平安後期
中世 1185- 1392 鎌倉南北朝時代 中世、中世初期、鎌倉(1185-1333)、吉野・南北朝(1331-1392)
中世 1392- 1568 室町時代 中世、中世後期、足利(1336-1568)、北山(1398-1467)、東山(1467-1531)、戦国(1532-1600)
近世 1568- 1615 桃山時代 近世(1568-1624)、安土桃山(1568-1615)、戦国(1532-1600)、聚楽
近世 1615- 1716 江戸時代前期 近世、江戸初期、徳川、慶長元和(1596-1623)、江戸前期(1615- 1715,1736)、元禄(1688- 1703)
近世 1716- 1804 江戸時代中期 近世、徳川
近世 1804- 1868 江戸時代後期 近世、江戸末期、徳川末、化政(1804-1829)、幕末
近代 1868- 1945 近代 明治(1868-1911)、明治大正(1868-1925)、大正(1912-1925)、大正・昭和前期(1912-1945)
現代 1945- 現代 戦後(1945-)、昭和後期(1945-1989)、平成(1989-)

上記は、筑波大学で行われた、日本美術シソーラスで使われた「時代区分」です。“大時代”“時代区分”と木構造にしてその下位に“時代名・様式”として同レベレの名前を配しています。これはこれで、シソーラスとしてはいいのでしょうが、細部にわたって検討が必要です。

時代区分
原始 1100
縄文 1110
古代 1200
弥生 1210
古墳 1220
飛鳥 1230
白鳳 1240
奈良 1250
平安 1260
平安前期 1263
平安中期 1265
平安後期 1267
中世 1300
鎌倉 1310
鎌倉前期 1313
鎌倉中期 1315
鎌倉後期 1317
南北朝 1320
室町 1330
室町前期 1333
室町中期 1335
室町後期 1337
近世 1400
安土桃山 1410
江戸 1420
江戸前期 1423
江戸中期 1425
江戸後期 1427
近代 1500
明治 1510
大正 1520
昭和 1530
現代 1600
時代未詳 1999
朝鮮古代 2100
朝鮮三国 2110
朝鮮高句麗 2111
朝鮮百済 2112
朝鮮新羅 2113
朝鮮統一新羅 2120
朝鮮中世 2200
朝鮮高麗 2230
朝鮮近世 2300
李氏朝鮮 2340
朝鮮近代 2400
朝鮮時代未詳 2999
中国古代 3100
中国仰韶文化 3110
中国竜山文化 3115
中国夏 3121
中国殷 3122
中国周 3123
中国春秋 3124
中国戦国 3125
中国秦 3126
中国漢 3127
中国後漢 3128
中国六朝 3130
中国三国 3131
中国魏 3132
中国晉 3133
中国蜀 3134
中国呉 3135
中国五胡十六国 3136
中国南北朝 3140
中国南朝 3141
中国宋 3142
中国斉 3143
中国梁 3144
中国陳 3145
中国北朝 3150
中国北魏 3151
中国西魏 3152
中国東魏 3153
中国北斉 3154
中国北周 3155
中国隋 3160
中国唐 3170
中国渤海 3177
中国中世 3200
中国五代 3210
中国遼 3215
中国北宋 3217
中国南宋 3218
中国西夏 3220
中国金 3230
中国元 3240
中国明 3250
中国近世 3300
中国清 3310
中国近代 3400
中華民国 3410
中国時代未詳 3999
東南アジア 4000
インド 5000
西アジア 6000
ヨーロッパ 7000
アフリカ 8000

上記は、私のデータベースで作った、時代コード表です。大ざっぱには、これですましています。というのも、たとえば、平安時代としか書かれていないデータでも、厳密に平安前期か後期かを決めなくてもいいように、大分類としての平安時代を設定しています。また、もっと大きな分類としての、古代、中世、近世といった項目も設けていますので、時代が確定できなくても大きな分類に納めておけるようにしたものです。

さて、彫刻作品のデータベースでは、どういう時代コードの設定をしたらいいのでしょうか。というのも、作品データの場合、それを加工するには、抽出と並べ替えがいかに的確にできるかが問題なのです。

確かに、時代コードで設定したとしても、抽出によってその時代のグルーピングはできますが、並べ替えができないのです。作品の前後関係をデータとして表すことは、現在のところむずかしいという結論に至りました。前後関係を区別するコードがつくれないのです。

そこで、考えたのが、「時代コード」でした。これは、4~5桁の数値にしたコード表です。最初の1~2桁は時代コードで、1 飛鳥 2 白鳳 3 奈良・・・10 江戸 というように時代名をコードにしたもの、次の2桁は世紀、末尾の1桁は世紀区分というものです。

世紀区分とは、0 頃、1 初期(0~9)、3 前半(10~39)、5 中頃(40~59)、7 後半(60~89)、9 末期(90~99)というふうに便宜的につけたコード番号です。カッコ内は西暦の末尾2桁です。

たとえば

  • 鎌倉時代13世紀後半   6137
  • 室町時代15世紀頃    8150
  • 江戸時代(世紀不明)   10990
  • 1250年造立        6135

のようにつけられます。これですと、並べ替えはできなくとも、かなり細部にわたってのグルーピングができますので、あとは、手作業での並べ替えということになります。

このコード表の長所は、たとえば、円成寺大日如来坐像の1176年をこのコード表で表すと、6127 となります。つまり、鎌倉時代12世紀後半 というくくりになります。平安後期にのくくりには入ってこないことになります。

このコード表は、現時点では、我ながらいいコード表だと思っています。データの入力をこなしていくうちにその使い方にも安定感がでてきました。

ただそれでも、このコード表ではどうにもならないことが数多くあります。たとえば、彫刻作品の時代判定が、室町~江戸 というもの、藤末鎌初 院政期 といった、時代をまたがるものについては、何ともしがたく、あくまでも便宜的に古い時代にいれるということにしています。したがって、その精度はどうしても落ちざるをないのです。

コンピュータの並べ替えの威力を十分に使いたいのですが。 

| | コメント (0)