5ちゃんねる ★スマホ版★ ■掲示板に戻る■ 全部 1- 最新50  

■ このスレッドは過去ログ倉庫に格納されています

日本語処理

1 :デフォルトの名無しさん:02/05/08 10:54
おもにJIS/EUC/SJISについてのスレ

2 :デフォルトの名無しさん:02/05/08 11:00
区点コードの話題も歓迎。

3 :デフォルトの名無しさん:02/05/08 11:02
また糞スレか……、と思いつつも、とりあえず様子見。

4 :こういうのじゃないよな:02/05/08 11:43
import java.io.*;
import java.util.*;

public class BakaRef {

public static void main(String args[]) {
Baka 内部クラスインスタンス = Baka.getBaka( 2 );

内部クラスインスタンス.set漢字変数("ほげ");
System.out.println( "内部クラス:"+ 内部クラスインスタンス.get漢字変数());
}

}

かえって読みにくいからやめようね

5 :デフォルトの名無しさん:02/05/08 12:13
えっと、EUCの漢字判定ってどうやるんですか?
(SJISのiskanjiみたいなやつ)

6 :デフォルトの名無しさん:02/05/08 12:16
>(SJISのiskanjiみたいなやつ)

何これ?

7 :デフォルトの名無しさん:02/05/08 12:25
int iseuckanji(char ch){
return (ch & 0x80) != 0;
}

8 :5:02/05/08 12:29
>>7ありがd

9 :デフォルトの名無しさん:02/05/08 12:31
telnetアプリ作ってて必要になったので
>>6iskanji、知らない?

10 :6:02/05/08 13:13
>>9
えーと、知らないから聞いているんです。
有名なモジュールのメソッドか何か?

11 :デフォルトの名無しさん:02/05/08 13:28
>>10
聞く前にとりあえず検索してみてください。
http://google.yahoo.co.jp/bin/query?p=iskanji&n=25&hc=0&hs=0


12 :6:02/05/08 13:56
うーん、正直、iskanji が何だろうがどうでも良いんだけどね。
検索先まで追って調べる気はないよ。


13 :デフォルトの名無しさん:02/05/08 15:58
質問する方が偉そう…アフォカ

14 :デフォルトの名無しさん:02/05/10 08:45
漏れの日本語処理が変です。
なんとかしてください。
おながいします。

15 :デフォルトの名無しさん:02/05/10 22:49
6はVB厨さんかな?

16 :6 ◆9NT64xD6 :02/05/11 01:17
残念ながら、

仕事は VC++/Perl が多いです。たまに VB もやるけど。
趣味では サーバサイドの Java で遊んでます。

なんでだろ?
iskanji って聞けば、みんながみんな、「あれのことか」と
思い浮かべるほど、有名なものなんだろうか。

調べろ?いや、やっぱりどうでも良い。

ということでした。

17 :結論。:02/06/09 11:32
iskanji は C言語のライブラリ。
なので C++ で仕事出来てるとは推測しがたい。


18 :デフォルトの名無しさん:02/06/09 12:23
iskanjiはいろいろな環境にある。
本当に漢字かどうかを調べるなら正規表現を使うだろうが。


そういえばTclってユニコード対応になったんだっけ?
とりあえず日本語処理はRubyで十分過ぎるけど。

19 :デフォルトの名無しさん:02/06/30 23:16
nkfを使え

20 :デフォルトの名無しさん:02/06/30 23:18
hogehogehoge

21 :デフォルトの名無しさん:02/07/15 03:06
いまさらなんだけど、

>>18
>本当に漢字かどうかを調べるなら正規表現を使うだろうが。

漢字判定と正規表現って、関係あるの?

22 :デフォルトの名無しさん:02/07/15 03:07
関係ないの?

23 :デフォルトの名無しさん:02/07/15 03:09
全く関係無い。
>>18はアフォ。
以上。


24 :おそらく、:02/07/15 03:10
18=6=アフォ

25 :名無しさん@カラアゲうまうま:02/07/15 05:23
>>21
漢字と仮名を区別する場合、って意味じゃねーの。

それにiskanjiなんてのは環境依存。>>17のほうがアフォ。

26 :デフォルトの名無しさん:02/07/15 06:09
結局クソスレになってしまったか… 黙祷

27 :デフォルトの名無しさん:02/07/15 09:14
>>4ってあほだな。


28 :デフォルトの名無しさん:02/07/15 09:15
>>21
関係あるよ。 正規表現で拾えるだろ

29 :デフォルトの名無しさん:02/07/15 09:30
>>28
果てしなく薄い関係だな。

30 :デフォルトの名無しさん:02/07/15 09:57
漢字判定とオブジェクト指向って、関係あるの?
漢字判定と.NETって、関係あるの?
漢字判定とマイクロソフトって、関係あるの?

31 :デフォルトの名無しさん:02/07/15 12:43
Windows でプログラムする際、
MBCSかUNICODEかどっちがよいでしょう?

32 :デフォルトの名無しさん:02/07/15 12:45
どっちでもよいでしょう?

33 :デフォルトの名無しさん:02/07/15 12:58
#define UNICODE
しとけば「このアプリは国際化対応です」といえますか?

34 :デフォルトの名無しさん:02/07/15 13:02
いえますでしょう?

35 :デフォルトの名無しさん:02/07/15 13:08
いえますです?

36 :デフォルトの名無しさん:02/07/15 13:11
UNICODEにする長所、短所ってなにがあるでしょう?
MBCSも。

37 :名無しさん@カラアゲうまうま:02/07/15 15:06
WindowsでいうUNICODEってUTF-16だからなー。

38 :デフォルトの名無しさん:02/07/15 15:31
>>37
だから なんだよ

39 :デフォルトの名無しさん:02/07/15 16:52
まさきひょうげん

40 :デフォルトの名無しさん:02/07/15 19:43
どっちかっつーと、まさのり、かなと。


41 :デフォルトの名無しさん:02/07/16 03:10
>>25
>それにiskanjiなんてのは環境依存。>>17のほうがアフォ。

環境依存ってどういうこと?
SJISなら判定方法どの環境でも同じだよね?

42 :デフォルトの名無しさん:02/07/16 03:21
>>41
iskanjiは標準ライブラリの定義の中には無いってことでは?
処理系毎に用意されてるものを使うか、昔の雑誌から引っ張ってくるか、
自分で書くか。
まあ、超有名マクロには違いないなわけで、Cで文字列処理したこと
あるやつは誰でも1つぐらいストックは持ってるだろうし、
使い方もみんな同じだと思う。

環境依存という程の問題ではなさそうだが。

43 :デフォルトの名無しさん:02/07/16 03:32
6=18=25=アフォ

44 :名無しさん@カラアゲうまうま:02/07/16 06:00
#define issjis1(c) ((unsigned char)(((c)^0x20)-0xa1)<0x3c)
テーブル引いた方が速いかもね。

45 :デフォルトの名無しさん:02/07/16 06:29
>>42, >>44
まともなスレに軌道修正してくれ

46 :名無しさん@Emacs:02/07/16 08:15
おい、お前らUNICODEを絶滅させて下ちい。

47 :デフォルトの名無しさん:02/07/16 08:44
>>37 >>46
初心者にもわかりやすく説明してください。


つねに2バイトつかうから?

48 :名無しさん@カラアゲうまうま:02/07/16 09:13
正確にはWindowsのはUCS2だったかもしれんが。

UNICODEには根本的に包接とかunificationの問題点があるし、
結果的に非互換な実装が乱立している。Yen problemとかもいろいろ。
UTF16にいたってはmulti wide-char stringという、訳の分からんキメラ状態だし。

UTF8はSJISとかよりも扱いが楽な部分もあるが。

49 :デフォルトの名無しさん:02/07/16 09:56
だから、サロゲートペアがあったりして、なんか腹立つ。

50 :デフォルトの名無しさん:02/07/16 11:11
質問ですが、 URL に使われる漢字コード って、なにを使うんですか?特に日本語ドメインをどう処理するか気になります。

調べろって?

51 :デフォルトの名無しさん:02/07/16 11:16
漢字ファイル/フォルダについてはutf-8こそが王道である、とMS
あたりならいうかもしれないけれど、実際には決まっていなくて、
現存するファイル名は、たいがいShift_JISだったりする。
 日本語(というより多言語)ドメインは、「UNICODEのRACEエンコード」、と
決まってはいる。使われてはいないが。

52 :デフォルトの名無しさん:02/07/16 11:58
>>51
多言語ドメインは使われてはいないけど、対応処理は考慮して作成して置かないと、そこから突っつかれる
可能性もある。あっちがうや、英数字だけでなく(使われていなくても)多言語を入力される恐れを考えておく
ってこと。

当たり前のことか。

9 KB
■ このスレッドは過去ログ倉庫に格納されています

★スマホ版★ 掲示板に戻る 全部 前100 次100 最新50

read.cgi ver 05.04.02 2018/11/22 Walang Kapalit ★
FOX ★ DSO(Dynamic Shared Object)