・CSVってなんですか?
Comma Separated Value の略で、各情報をカンマ記号で区切ったテキスト形式のフォーマット。
異なる表計算ソフト間などのデータ共有に広く利用可能。
...何やらもっとスマートに説明してくれないのかね、辞書ってものは。
つまり、カンマ , でデータを区切って並べます。一つのレコードは1行で書きます。
1個目が商品コードで2個目が品名というように横の並び(列)の順番を決めて書いていけば
様々なプログラムは読み込んだときにカンマで区切ってデータを認識していってくれます。
この区切りはカンマだけでもいいのですが、品名の中にカンマがあったりすると区切りがずれますので、
そのようなデータがあるときはダブルクォーテーションで囲みます。
こんな感じ。 "商品コード","品名"
・CSVファイルの文字コードは何にするのですか?
CGIの設定のデフォルトがShift-JIS用にしてあるので、CSVファイルはShift-JIS(sjis)にして下さい。
EUCにするなら、検索文字列もEUCで渡すよう、CGIを変更してください。今後選択できるようにしたいと思います。
えっと、JISコードはなんか検索が遅くなるようです。
・データの件数はどれぐらいいけますか?
SG-SEARCHはちょっとした検索を簡単に設置するという目的で作っています。
その為、全文検索のnamazuのように、あらかじめ検索用のインデックスファイルを作成して
検索の高速化をはかったりなど高度なことは全くしていません。
毎回検索するたびに、csvファイルを読み込んで検索を行います。
ですので件数もさることながら、列が多くなるにつれ、レスポンスは悪くなります。
主観になりますが、500件・10列以内ぐらいでおさめたほうが無難じゃないでしょうか?
大量件数の場合、サーバーに多大な負荷を与えますので注意して下さい。
csvを小分けにして、複数のSG-SEARCHで検索結果をリンクで渡していくような感じでごまかすしか対応はありません。
大きいデータで強行されますと、プロバイダーさんから閉め出される恐れもありますんで自己責任で!
・5Cを含む文字コードっていったいぜんたいどれですか?
Shift-JIS漢字コードだけの問題ですが、"○○5C" というコードの文字はPerlなどを使って表示すると
文字が化けます。以下の文字ぐらいしか知りませんがこれらの文字の後ろには \ マークをつけると
化けなくなります 。

・検索で引っかからない文字がありますが?
v1.2 でこの不具合は修正しました。検索できない文字や、ないのにヒットするとかなくなりました。