ベストアンサー 何通りの組み合わせ!? 2014/03/19 03:21 UTF-8 エンコーディング バイト ビット 表現形式 1 7 0bbbbbbb 以上ですが、何通り表現できるのですか!? 算数は苦手です。 宜しくお願いします。 みんなの回答 (1) 専門家の回答 質問者が選んだベストアンサー ベストアンサー bunjii ベストアンサー率43% (3589/8249) 2014/03/19 12:12 回答No.1 7bitの組み合わせは128組です。 2の7乗=128 質問者 お礼 2014/03/22 05:56 ご回答誠にありがとうございました。 2の7乗=128 計算方法が分かりました。 広告を見て全文表示する ログインすると、全ての回答が全文表示されます。 通報する ありがとう 0 カテゴリ [技術者向] コンピューターその他([技術者向] コンピューター) 関連するQ&A UTF8コードで1バイトの文字が2バイトで表現されているのですが・・・・? UTF8コードで1バイトの文字が2バイトで表現されているのですが・・・・? とタイトルの通りデータに UTF-8のデータを扱っていて 16進表記で『0xC341』と データが入ってきました。 0xC3…11000011 0x41…01000001 UTF-8の仕様で2バイト目の文字は先頭ビットが 10 から始まる仕様となっていると思いますが 2バイト目の先頭ビットが 0 の場合はUTF-8コードが 壊れていると判定してもいいんですか? それとも、2バイトの先頭ビットが0の場合 次のバイトを1バイト文字とし変換してあげて 0x41 → A として変換するなどといった 特殊な仕様が隠れていたりするのでしょうか? 今のところ壊れていると判断しているのですが、 UTF-8ではないコードだったりする可能性もあるかな? っと思い質問いたしました。 少し不安だったので、しっていましたら、教えてください。 以上 検索ワード UTF-8 2バイト目 1バイト文字 UTF-8とUTF-16について質問です。 まず、【あ】という文字をUTF-16というエンコーディング方式で バイト配列化すると [0] => 66 [1] => 48 というバイト値が帰ってきます。 これはとりあえずC#で処理を行いました。 Encoding encode = Encoding.GetEncoding("UTF-16"); String value = "あ"; Byte [] byteData = encode.GetBytes(value); それでは【あ】という文字の文字集合のコードポイントは右記となります。【0x3042】 これは、出力された 66、48という数値を16進数に変換すると 66=>42 48=>30 となり、リトルエンディアン環境で 0x4230という16進数であらわされるようです。 この点も不思議なのですが今回知りたいのはUTF-16でエンコーディングされた バイト配列はこのように文字集合のコードポイントに復帰?させることができますよね? ではUTF-8でエンコーディングされた【あ】という文字の バイト配列 [0] => 227 [1] => 129 [2] => 130 というバイト配列を上記のような文字集合のコードポイントの値へ復帰させることは できるのでしょうか? それに伴いUTF-8でつかわれる文字集合もUTF-16と同じコードポイントなのでしょうか? 上記 1.UTF-8でエンコーディングされた文字列をバイト配列にした場合 元の文字集合に戻せるのか?戻せるならばその戻し方は? 2.UTF-8がさす文字集合とUTF-16がさす文字集合はおなじものですよね? 上記二点よろしくご教授ください。 encoding="UTF-16" ってUTF-16で書かれても。 以前からずっと疑問だったのですが。。。 XML宣言の中に、エンコーディングを記述するところがありますが、その宣言文字列自体をそのエンコーディングで記述するというのはおかしくないでしょうか。 たとえば、UTF-16だったら、 encoding="UTF-16" と書くわけですが、これ自体がUTF-16で書かれているわけですよね? UTF-16で書かれているとわかっていたら宣言する必要はないし、宣言読まないとわからないんだったら、この宣言自体も読めないはずです。 今実際に、UTF-16で書かれていて、エンコーディング宣言もしているXML文書をあるソフトで読もうとしているのですが、1バイト目を読んだところで「Unexpected character. position = 0 」と出力されてエラーになります。 強制的にUTF-16で読ませる昨日もあるので、そうすればエラーは起こりませんが、それじゃエンコーディング宣言の存在自体に意味がないのでは? これは、最初の時点で読めないこと自体がこのソフトの不具合なのでしょうか? これってどういうことなんでしょう。解決できるんでしょうか。 ネットワークエンジニアとは?技術職の未来を考える OKWAVE コラム 1バイトのみのテキストのエンコーディング 「Googleサイトマップ」用にテキスト形式のサイトマップファイルをアップロードしたところ、文頭に何か2バイト付加されてエラーになりました。 MAC OS9でJedit3からUTF-8/LFで保存したもので、サイトのURLを羅列しただけの内容です。 WINDOWSのK2EditorでUTF-8Nにして再送信しましたが、まだGoogleが確認していません。 そこで大変基本的(初歩的)な疑問ですが、1バイトASCII文字のみのテキストファイルをUTF-8エンコーディングで保存して再度開くとエンコーディングはどうなるのでしょうか? 改行コード(CR/LF)はShift-JISと同じ(0D/0A)なのでしょうか。そうだとすると保存するときの「漢字コード」がShift-JISでもUTF-8でも2バイト文字を含まない場合は結果(ファイルの内容)は同じになるのでしょうか? テキストファイルの内容(漢字コードや制御文字)を見るツールなんてものがあるのでしょうか。 UTF-8とUTF-16およびUTF-32について Unicodeにおける各文字エンコーディングについてですが なぜ、UTF-16およびUTF-32の文字コードがビッグエンディアンとリトル・エンディアンの二通りの組み合わせを許容できてUTF-8が許容できないのかがわかりませんなぜでしょうか? HTTPリクエストにおいて送信できるHTTPヘッダ HTTPに明るいかたに質問です。 下記URLにHTTPヘッダーに含めることのできる文字はASCIIを拡張した8bitASCIIだと 記載があります。 参考URL http://www.studyinghttp.net/header#Utf8InParam このURLにはHTTPヘッダ、特にPOSTメソッドでリクエストを投げる際は、 パーセントエンコーディング(URLエンコードとは言わないのですね・・・。💦) をおこなって、拡張ASCIIの8bitで対応できる文字として符号化して送信するような記述があります。 たしかに、IEなどの特定のブラウザだとアンカータグのhref属性に日本語のパラメータをいれたリンク先をつくると 正しく送信できないときがあったような気もします。 もちろんHTTPの仕様がパーセントエンコーディングとなっている以上、それが正しいやりかたなのでしょうが、 考えればUTF-8なども8bit単位で符号されて 結果【あ】という文字は[¥xe3¥x81¥x82]という16進数のバイト列で表現できていますよね。 ということは、文字列を正しく符号化していえれば拡張ASCIIつまり8bitの範囲でおさめる事ができているのではとおもったのです。 パーセントエンコーディングも必要ないのではと思うのですが・・・。 上記に造詣の深い方、是非ご教授ください。 よろしくお願いします。 Mac OS10.4 テキストエディットでエンコード「Shift_jis」での保存ができません 仕事でhtml書類にて提出する文書があります。 テキストエディットにてhtmlを打ち込みましたが、いざ保存しようとして、エンコーディングを指定しようとすると・・・ 【選択したテキストエンコーディング“日本語(Shift JIS)”で書類を保存できませんでした。別のエンコーディングを選んでください。】 というメッセージが表示され、保存できません。 ちなみに、Unicode(UTF-16)、Unicode(UTF-8)、中国語(GB18030)しか選択できません。 Unicodeでは書類にエラーが出てしまうのでどうしてもシフトJIS形式のエンコードで保存する必要があります。 アプリケーションはテキストエディットではなくても、 「シフトJISにて保存」出来ればどのアプリケーションでも構いません。 分かる方どうかよろしくお願い致します。 玉の落ちる組み合わせ・確率 ふと、組み合わせを考えていたら、自分で解き方すら全く分からない 問題を考えてしまったのですが、算数に詳しいかたお願い出来ます でしょうか? 例えば、ピンボールのように玉をはじいて、5つの枠内のどれかに その玉が落ちるとします。 それを6回繰り返して6個の玉を落とすのですが、 『1枠に2個以上の玉が落ちる確率』は、 100%ですよね? <2個以上落ちる例> ┃ ┃ ┃ ┃ ┃ ┃ ┃ ┃ ┃ ┃ ┃ ┃ ┃●┃ ┃ ┃ ┃ ┃ ┃●┃●┃●┃●┃●┃ ┗━┻━┻━┻━┻━┛ ※5つの枠に対して6個の玉を落とすので、どんなにバラけても 必ず2個以上落ちる枠が存在。 ここで、 『1枠に3個以上の玉が落ちる確率』 とした場合の、その確率がわかりません。 <3個以上落ちる例> ┃ ┃ ┃ ┃ ┃ ┃ ┃●┃ ┃ ┃ ┃ ┃ ┃●┃ ┃●┃ ┃ ┃ ┃●┃ ┃●┃●┃ ┃ ┗━┻━┻━┻━┻━┛ 組み合わせで考えると、枠が5つ・玉が6個なので、5の6乗の 組み合わせになると思います。 そうすると、5の6乗=15625通りも考えることになって 現実的ではないので、何か、確率の計算方法で単純に求められ るのではないかと思ってますが、それがさっぱり分かりません。 組み合わせ (1)白の碁石が9個ある。これを、組を区別せずに、どの組も4個以下となるように3組に分ける方法は何通りあるか?また、A、B、Cの3人に、1人当たり4個以下になるように分ける方法は何通りあるか? (2)9個の白の碁石をA、B、Cの3人に分ける。全員少なくとも1個はもらえるような分け方は何通りで、1つももらえない人がいてもよいとすると何通りになるか? (3)赤球4個、青球4個、黄球1個と黒の碁石2個の合計11個を1列に並べる。球が続けて5個以上現れない並べ方は○○×□□□通りある。 区別せず、や、区別して。少なくとも~ と聞かれると、何が何だかわからなくなってしまいます。 参考書を読んで、同じような問題の解法を見たのですが、いまいち解き方のコツがわかりません。 また、(3)のような問題は初めて見るので、ヒントがほしいのですが… (1)~(3)の問題の解き方を教えて下さい。 私は組み合わせの問題が苦手なので、もしこの問題だったらこのパターン! などのコツがあったら教えて下さい。 お願いします。 画像だけが表示されないWebサイト 標準のUnicode(UTF-8)では文字化けしてしまうwebページを、テキストエンコーディングで日本語(EUC)に変更したらやっと見られるようになりましたが、画像だけは見られません。Safariでもシイラでも同様です。これはどうしてですか? 全てのテキストエンコーディングを試したわけではなく、日本語とあるものだけ変えてみたんですけど、必ずすべてを見られるテキストエンコーディングがあるものなんですか? 画像だけが表示がされない場合は、どこを操作すればいいんですか? WebサイトはAdobeのPDFをHTML化したページです。 (だから普通にダウンロードすれば見ることはできるんですが・・) PDF苦手なので、よろしくお願いします。 UTF-8とUnicodeの互換性 Windowsで使用されているUnicodeはUTF-16と理解しているのですが、 UTF-16→UTF-8は変換できると思いますが、 UTF-8→UTF-16の変換は一意に変換されるものなのでしょうか? UTF-16は2バイトなので65,535文字が上限になり、 一方UTF-8は1~6バイトで、実質データ部は最大4バイトなので 表現できる文字数が違うので「UTF-8→UTF-16」の完全変換は無理なのでは?と思っています。 ご存知の方すみませんがどうぞご教授ください。 この問題の解法が分かりません。 【問題】 4バイト(最上位ビットから1ビットの符号ビット、7ビットの指数部、24ビットの仮数部からなる)の数値で表現する浮動小数点を考える 。この形式で表現される浮動小数点数の絶対値は、 16^n * (f1 / 16 + f2 / 16^2 + f3 / 16^3 + f4 / 16^4 + f5 / 16^5 + f3 / 16^3) となる。ただし、nの負数は2の補数で表すものとする。また、fi(i=1,2,3...6)は、0から15までの数値である。例えば、10進数の16.5は 16.5=16^2*(1/16+0/16^2+8/16^3)…(1) であるから、浮動小数点形式では16進数表示で02108000・・・(2) となり、 -16.5は82108000・・・(3) となる。 分からないのは、問題文中の「例えば~」以降で(1)、(2)、(3)がどうしてそのように表されるのか理解できません。分かる方詳細に教えてください。 AIは使う人の年齢や市場にも影響する?人工知能の可能性 OKWAVE コラム 2次元コード、バーコード、RF-IDの性能比較 8bit(ビット)=1B(バイト)=>2^8=256通りですよね。英数字が256通りでカバーされるので1B文字。漢字ひらがなカタカナは2^16=65536通りでカバーされ、2バイト文字ですよね。 そうすると2次元コードは1KBの容量があるとするならば、理論的には1KB=2^10B=1024Bなので=1024文字の表現が可能で、2B文字なら512文字。またバーコードは128Bとすると1B文字が128文字、2B文字が64文字の表現が可能。 以上の計算でよいのですよね? そしてRF-IDは64KBとすると1024*64文字(1バイト文字の場合)もの表現が可能でしかもメリットとして電波式であるといえますか? 算数の苦手な子の悩みです。 算数の苦手な子の悩みです。 ■0.12×0.15=180とやったりします。 ■「これは90度よりも、でかいだろう」 という角度を76度と答えたりします。 ■34-□=5 を解くのに、 34+5で、求めようとすることがあります。 以上に共通しているのは、(私の考えでは) 数字が数字としてしか見えていない。 数字が量や質をイメージできていない( うまい表現がわかりません・・)。 そういったことにあると思いました。 仮に以上の見解があっているとして、次に「ではどうすれば、その力がつくのか?」といわれると、これまたわかりません。 どなたか、アドバイスをいただけないでしょうか?? テキストファイルの先頭から文字を1文字ずつ取得し、 テキストファイルの先頭から文字を1文字ずつ取得し、 同時に各文字の文字コード、バイト数、及びファイルポインタを取得したいです。 ただし改行、タブ、BOM、及びファイル末尾の連続する空白は除外します。 扱うテキストファイルのエンコーディング方式は統一されませんが、 Shift_JIS、EUC-JP、UTF-8、UTF-16LEに限定されると思います。 尚、テキストファイルのエンコーディング方式の特定については、 外部リソースへの問い合わせにより解決します。 例として次の様なファイルがあります ファイル名:test.txt コーディング方式:Shift_JIS 内容:あiウ この場合ですと、 1文字目 ├文字コード=あ ├バイト数=2 └ファイルポインタ位置=0 2文字目 ├文字=i ├バイト数=1 └ファイルポインタ位置=2 3文字目 ├文字=ウ ├バイト数=1 └ファイルポインタ位置=3 となり、上記ファイルのエンコーディング方式がUTF-8であった場合、 1文字目 ├文字=あ ├バイト数=3 └ファイルポインタ位置=0 2文字目 ├文字=i ├バイト数=1 └ファイルポインタ位置=3 3文字目 ├文字=ウ ├バイト数=3 └ファイルポインタ位置=4 となって欲しいです。 現在色々調べつつやっていますが、なかなか具体的な方法が見えてきません。 InputStreamReaderクラスを使ってエンコード方式を指定すれば中身を読めますが、読み込み元のバイト数が取得出来ず、ポインタも取得できません。 しかしRandomAccessFileクラスを使って読むとポインタの取得行える物の、エンコーディング方式を指定できません。 そんなこんなではまりこんで困っております。どういったクラスを使えば良いか等、情報をいただければ幸いです。 どうかお助け下さい。 順列と組み合わせ? 情報処理関係の問題で、以下の問題があるのですが、こういった計算問題が苦手なので、解放の仕方をご教授いただければ助かります。 よろしくお願いいたします。 2種類の文字“X”,“Y”を1個以上,最大n個並べた符号を作る。60通りの符号を作るときのnの最小値は幾らか。 16ビットが65536バイト? 来週のIPAのテストに向けて勉強中です。 来週なのにわからないことだらけで焦っています。 8ビットが1バイトですよね? IPパケット長のフィールドが16ビット、つまり2バイトです。 16ビットで表すことのできるができる大きさは2^16=65536ということも理解できます。 が、単位は何になるのでしょうか? いろいろなテキストには65536バイトと書いてあります。 65536まで表現できるのはわかるのですが、なんで単位がバイトになるのかが、わかりません。 どなたか教えてください。 組み合わせが何通りあるか 昔学んだ順列組み合わせの知識をふりしぼっても解けないのでよろしくお教えください。 赤玉2個、白玉2個、緑玉2個がある。 x、y、zの3人でこの玉を2個ずつ分けるとき、その組み合わせは何通りあるか。 どのように考えたらよいでしょうか。 組み合わせが何通りあるか知りたい こんにちは タイトルの通りなのですが、例えば ABC の場合、 ABC ACB BAC BCA CAB CBA ・・・と、6通りあります まず、このような組み合わせを求めることを、数学では何と呼べばよいでしょうか 本題ですが、ABCDE について同様に求めたいのですが、数列で求めようとしたところ(数列の意味がよく分かっていないかもしれません。間違っていたらゴメンナイ)、 1,2,6,24,80 その階差数列は、 1,4,18,56 ・・・です どう手をつけてよいか、サッパリわかりません よろしくお願い致します mb_detect_encoding()関数について かなり初歩的な質問かもしれませんが、とあるサイトを参考に、以下のスクリプトを作って文字コードをEUC、 改行コードをLFにして保存し、実行しました。 <?php $str="PHP練習"; print mb_detect_encoding($str); ?> これを実行した結果は、 UTF-8でした。 てっきり保存した文字コードが出力されると思ったんですが違いました。ためしに今度は「$str="PHP練習";」の部分を「$str="PHP";」に してみたらASCIIと出力されました。 さらに今度は「mb_detect_encoding($str);」の部分を、 「mb_detect_encoding($str,"UTF-8");」にして実行したら、 UTF-8と出力されました。 「mb_detect_encoding($str,"SJIS");」にして実行したら、 SJISと出力されました。 あといろいろ$strの中の文字を変えたりしてみましたが、 たまに何も出力されないときもありました。 サイトの説明を見たら、「mb_detect_encoding()関数は、文字列のエンコーディング形式を検出します」と書いてありました。 この「文字列のエンコーディング形式」というのは何によって決まるのでしょうか? 注目のQ&A 「You」や「I」が入った曲といえば? Part2 結婚について考えていない大学生の彼氏について 関東の方に聞きたいです 大阪万博について 駅の清涼飲料水自販機 不倫の慰謝料の請求について 新型コロナウイルスがもたらした功績について教えて 旧姓を使う理由。 回復メディアの保存方法 好きな人を諦める方法 小諸市(長野県)在住でスキーやスノボをする方の用具 カテゴリ [技術者向] コンピューター OS(技術者向け) データベース プログラミング・開発 業務ソフトウェア ITシステム運用・管理 その他([技術者向] コンピューター) カテゴリ一覧を見る OKWAVE コラム 突然のトラブル?プリンター・メール・LINE編 携帯料金を賢く見直す!格安SIMと端末選びのポイントは? 友達って必要?友情って何だろう 大震災時の現実とは?私たちができる備え 「結婚相談所は恥ずかしい」は時代遅れ!負け組の誤解と出会いの掴み方 あなたにピッタリな商品が見つかる! OKWAVE セレクト コスメ化粧品 化粧水・クレンジングなど 健康食品・サプリ コンブチャなど バス用品 入浴剤・アミノ酸シャンプーなど スマホアプリ マッチングアプリなど ヘアケア 白髪染めヘアカラーなど インターネット回線 プロバイダ、光回線など
お礼
ご回答誠にありがとうございました。 2の7乗=128 計算方法が分かりました。