2011年6月27日月曜日

アラビア語辞書データ更新のお知らせ

この度、アラビア語辞書データを更新いたしました。

内藤浩二氏が作成されました、
『アラビア語-日本語電子辞書データ』
の「中級辞書Ver.3.89(Unicode版)38,900語収録」
を完全収録いたしました。

長らく更新が途絶えておりまして
大変ご迷惑をおかけいたしましたことをお詫び申し上げます。
今後もOnlineアラビア語辞書ご利用いただければ幸いです。

アラビア語辞書リニューアル作業日誌

6/26の作業日誌
1-動詞の変化表を作る(とりあえず規則変化のみ)
2-データの確認

6/27の作業日誌
1-動詞の変化表をMySQLに格納(とりあえず規則変化のみ)
 7Ⅶ形追加終わり
 10Ⅹ形追加終わり
 8Ⅷ形追加終わり
 9Ⅸ形スキップ(極小のため)
 6Ⅵ形追加終わり
 5Ⅴ形追加終わり
 4Ⅳ形追加終わり
 3Ⅲ形追加終わり
 2Ⅱ形追加終わり
 1Ⅰ形追加終わり
  > サーバーくん、お疲れ様でした。毎度酷使してごめんなさい。شُكْرًا جَزِيلاً
    

2-クライアントの文字コードセットをSJISに変更します。
#mysql_query( "SET NAMES ujis", $db );
mysql_query( "SET NAMES utf8mb4", $db );

忘れてた。30分ロス。。。

3-onlineアラビア語辞書に接続
4-中級辞書にデータ切り替え
5-告知

今週のtodoリスト
不規則動詞の対応幅を広げる
名詞の変化も対応するように
キーボードそろそろ作る?

2011年6月26日日曜日

アラビア語の文字のバイト数

アラビア語の文字のバイト数で単語の分解しようと思うのだけれど、
何故か同じ3文字の単語でもバイト数にばらつきが・・・
語根を判別できないのです。。
ご存知の方、教えてください。

I want to know the byte of an Arabic word ,
but some Arabic words are 6 bytes and other Arabic words are 9 bytes .

Why does these difference is happenned ?
I want to know the each root of an Arabic word.
If you know , please teach me .

2011年6月25日土曜日

アラビア語と日本語併記

アラビア語と日本語の併記に悩まされるのは今に始まったことでは有りません。
リニューアルに関し、非常に役に立ったソフト群をご紹介いたします。

Kuto Csv Editor
CSVファイルを快適に編集・閲覧できる、タブ切り替え型のCSVエディタ
と紹介されてますが、「unicode 表計算ソフト」でヒットしました。
実際アラビア語辞書データを文字化けせずに一覧できるソフトは初めてでした。


EmEditor
多くの文字コード・プログラム言語に対応したフリーのテキストエディター
こちらは、アラビア語、日本語併記可能なテキストエディターです。
プログラム開発も可能です。

アラビア語辞書リニューアル手順2011

技術力アップと環境改善のため、いろいろ変更点が。
発音データは今回も利用、アラビア語を扱えるMySQL(unicodeバージョン)が
使えるようになったので、存分に活用します。

(同じ)1-アラビア語-日本語電子辞書データから最新辞書をダウンロード

(同じ)2-ユニコードVer.

(変更)3-File 辞書設定(詳細)
    若干PDICソフトが変わったかも?

(変更)4-Tool 辞書の変換 (CSVデータ形式で出力)
    改行トラブルは正規表現でなんとかクリア

(変更)5-CSVデータ形式の最新辞書をアップロード
    CSV形式をアップロード (UTF-8で保存。改行はLF形式)

(同じ)6-http://www.arab.jp/level4/display_arabic.phpを開く
    日本語とアラビア語一度にそのままMySQL保存できるか?

    データ量が多くなるので10件ずつに減らしたほうがスムーズかも。
    やっぱり改行のタイミングがずれるとまずいので、従来のファイル保存形式に
    その後、CSVファイルをMySQLに一括登録で

(同じ)7-動作テスト

(同じ)8-問題ナッシングなら公開

(同じ)9-労働時間はプライスレス

*過去の問題点
 動詞活用後のマッチング率を改善

アラビア語辞書リニューアル2011

長らく更新が途絶えておりまして申し訳ございません。

近々、内藤浩二氏が作成されました、
『アラビア語-日本語電子辞書データ』 
の「中級辞書Ver.3.89」に辞書データを更新する予定でございます。

よろしくお願いいたします。