タグ付けされた質問 「intel」

Intel半導体チップとアセンブリ、Intelアーキテクチャ機能とISA拡張機能、およびIntelチップマイクロアーキテクチャに関連する問題。

19
AMDプロセッサーでAVDを起動する際のエラー
AMDプロセッサを搭載したWindows 8.1 proを使用しています。Android SDKとEclipseをインストールしました。動作しますが、問題は、AVDを作成して起動すると、次のエラーが表示されることです。 エミュレーター:エラー:x86エミュレーションには現在ハードウェアアクセラレーションが必要です! Intel HAXMが適切にインストールされ、使用可能であることを確認してください。 CPUアクセラレーションステータス:HAXカーネルモジュールがインストールされていません! Intel Hardware_Accelerated_Execution_Managerをすでにインストールし、ブートメニューから仮想変調を有効にしていますが、それでも機能しません。
680 android  intel  avd  haxm 


4
Intel SandybridgeファミリCPUのパイプライン用のプログラムの最適化解除
私はこの割り当てを完了するために一週間頭を悩ませてきました、そして私はここの誰かが正しい道に向かって私を導くことを望んでいます。インストラクターの指示から始めましょう: あなたの割り当ては、素数プログラムを最適化することでした最初のラボの割り当ての逆です。この割り当ての目的は、プログラムを悲観的にすること、つまりプログラムの実行を遅くすることです。これらは両方ともCPUを集中的に使用するプログラムです。ラボPCでの実行には数秒かかります。アルゴリズムを変更することはできません。 プログラムを最適化解除するには、Intel i7パイプラインの動作方法に関する知識を活用してください。WAR、RAW、およびその他の危険性を導入するために命令パスを並べ替える方法を想像してみてください。キャッシュの効果を最小限に抑える方法を考えてください。悪魔のような能力がない。 この割り当てでは、砥石またはモンテカルロのプログラムを選択できました。キャッシュ効果のコメントは、ほとんどがWhetstoneにのみ適用されますが、私はモンテカルロシミュレーションプログラムを選択しました。 // Un-modified baseline for pessimization, as given in the assignment #include <algorithm> // Needed for the "max" function #include <cmath> #include <iostream> // A simple implementation of the Box-Muller algorithm, used to generate // gaussian random numbers - necessary for the Monte Carlo method below …

16
Android用の新しいIntelエミュレーターの実行
最近、GoogleとIntelはエミュレータを実行する新しい方法を公開しました。これは、以前のバージョン(ARM CPUをエミュレートしていたバージョン)よりもはるかにうまく機能するはずです。ここにいくつかのリンクがあります:これとこれ。 しかし、新しいコンポーネントをインストールし、指示に従って新しいエミュレーター構成を作成した後、エラーが発生し、改善も見られません。私はAPI 10とAPI 15の両方を試し、GPUを有効および無効にしました。それらの構成はどれも役に立ちませんでした。また、2台の異なるコンピューターで試してみましたが、ブーストは発生しませんでした(同じエラーが発生しました)。 私がそれについて読んだ投稿では、誰もそれについて問題を抱えておらず、すべてがはるかに高速なエミュレータを報告しているようです。 それが示すエラーは: emulator: Failed to open the HAX device! HAX is not working and emulator runs in emulation mode emulator: Open HAX device failed なぜそれが起こっているのですか?それを修正する方法はありますか?他にそれらのエラーを受け取る人はいますか? ちなみに、私はIntel CPUを持っていますが、問題があるかもしれません。 編集: ここに私がBIOSで見るものがあるので、それは利用できるはずです...:

25
エミュレータ:エラー:x86エミュレーションでは現在ハードウェアアクセラレーションが必要です
Android StudioでHello Worldアプリケーションを実行しようとしました。次のエラーが発生しました: エミュレーター:エラー:x86エミュレーションでは現在、ハードウェアアクセラレーションが必要です! Intel HAXMが適切にインストールされ、使用可能であることを確認してください。 CPUアクセラレーションステータス:HAXカーネルモジュールがインストールされていません! エラーで何ができるか教えていただけますか?

30
「Failed to sync vcpu reg」エラーを修正するにはどうすればよいですか?
Intel HAX x86エミュレーターWindows(8が重要な場合)を使用しようとしています。すべてをインストールしてAndroidバージョンのAVDを作成しましたが、すべて正しく表示されますが、実行すると次の出力が得られます。 Starting emulator for AVD 'x86_QVGA_Level10' emulator: device fd:1044 HAX is working and emulator runs in fast virt mode emulator: Failed to sync vcpu reg emulator: Failed to sync HAX vcpu context エミュレータは実行されません。このエラーの重要な部分は、HAX自体のソースコードを(Failed to sync vcpu reg)除いて、オンラインのどこにも言及されていませんが、これを理解する方法がわかりません。 誰かがこのエラーを乗り越える方法についてアドバイスできますか?デバイスとデフォルトのエミュレーターでのデバッグは非常に遅いので、私は本当にこれを機能させる必要があります。


16
Intel HAXMインストールエラー-このコンピューターはIntel Virtualization Technology(VT-x)をサポートしていません
HAXMのインストールに問題があります。ここにあるものです。コンピュータにHAXMをインストールしようとするたびに、このエラーが発生しました。 問題は、私のコンピューターが仮想化テクノロジをサポートしていることです(下の画像を参照)。この問題を修正する方法はありますか?

24
インテルHAXMをインストールできません
Android Studioをインストールしましたが、問題はありませんでした。しかし、エミュレータを実行しようとすると、Intel HAXMがインストールされていないと表示されました。 だから私はインストーラーを見つけて実行しましたが、私のラップトップはサポートしていると言われていましたが、有効化されていませんでした。私は行って、Intel Virtualization Technology(VT-x)を有効にしましたが、それでも同じメッセージが表示されました。 Hyper-Vを無効にする必要があるとのことですが、Windowsの機能の有効化/無効化に移動すると、その一覧に表示されません。 誰かがこれを手伝ってくれますか?

8
GCCが分岐予測を常に特定の方法で実行するように強制するコンパイラヒントはありますか?
Intelアーキテクチャの場合、GCCコンパイラに、コード内の特定の方法で常に分岐予測を強制するコードを生成するように指示する方法はありますか?Intelハードウェアはこれをサポートしていますか?他のコンパイラやハードウェアはどうですか? 私はこれをC ++コードで使用します。高速で実行したい場合がわかっており、他の分岐が最近必要になった場合でも、他の分岐を取得する必要があるときにスローダウンを気にしません。 for (;;) { if (normal) { // How to tell compiler to always branch predict true value? doSomethingNormal(); } else { exceptionalCase(); } } Evdzhan Mustafaの質問に続くように、ヒントは、プロセッサが命令に初めて遭遇したときにヒントを指定するだけでよく、その後のすべての分岐予測は正常に機能しますか?

6
インテルがプロセッサーの内部RISCコアを隠すのはなぜですか?
Pentium Pro(P6マイクロアーキテクチャ)から、Intelはマイクロプロセッサを再設計し、古いCISC命令の下で内部RISCコアを使用しました。Pentium Pro以降、すべてのCISC命令は小さな部分(uops)に分割され、RISCコアによって実行されます。 当初、Intelが新しい内部アーキテクチャを非表示にし、プログラマに「CISCシェル」の使用を強制することを決定したことは明らかでした。この決定のおかげで、Intelは互換性を損なうことなくマイクロプロセッサアーキテクチャを完全に再設計することができました。それは合理的です。 しかし、私は1つのことを理解していません。なぜ、Intelは内部RISC命令セットを何年も隠しているのですか?古いx86CISC命令セットを使用するように、プログラマーにRISC命令を使用させないのはなぜですか? Intelが下位互換性を長期間維持している場合(64ビットモードの隣に仮想8086モードがまだあります)、CISC命令をバイパスして、RISCコアを直接使用するようにプログラムをコンパイルできないのはなぜですか?これにより、x86命令セットをゆっくりと放棄する自然な方法が開かれますが、これは最近非推奨になっています(これが、Intelが内部でRISCコアを使用することを決定した主な理由ですよね?)。 新しいIntelの「Corei」シリーズを見ると、AVX、SSE4などを追加したCISC命令セットのみが拡張されていることがわかります。

1
Cコードループのパフォーマンス[続き]
この質問は、ここでの私の質問に続きます(Mysticalのアドバイスに基づいて): Cコードループのパフォーマンス 私の質問を続けると、スカラー命令の代わりにパック命令を使用すると、組み込み関数を使用するコードは非常によく似たものになります。 for(int i=0; i<size; i+=16) { y1 = _mm_load_ps(output[i]); … y4 = _mm_load_ps(output[i+12]); for(k=0; k<ksize; k++){ for(l=0; l<ksize; l++){ w = _mm_set_ps1(weight[i+k+l]); x1 = _mm_load_ps(input[i+k+l]); y1 = _mm_add_ps(y1,_mm_mul_ps(w,x1)); … x4 = _mm_load_ps(input[i+k+l+12]); y4 = _mm_add_ps(y4,_mm_mul_ps(w,x4)); } } _mm_store_ps(&output[i],y1); … _mm_store_ps(&output[i+12],y4); } このカーネルの測定されたパフォーマンスは、サイクルあたり約5.6 FP操作ですが、スカラーバージョンのパフォーマンスの正確に4倍、つまりサイクルあたり4.1,6 = 6,4 FPopsであると予想されます。 重み係数の動きを考慮に入れると(それを指摘してくれてありがとう)、スケジュールは次のようになります。 movssスカラーの重み値をXMMレジスタに移動し、shufpsこのスカラー値をベクトル全体にコピーするために使用する操作の後に追加の命令がありますが、スケジュールは変更されていないようです。mulps負荷から浮動小数点ドメインへの切り替え待ち時間を考慮に入れると、重みベクトルをしばらくの間使用する準備ができているようです。したがって、これによって余分な待ち時間が発生することはありません。 …

2
フォーク:再試行:リソースが一時的に利用できません[クローズ]
閉まっている。この質問はトピックから外れています。現在、回答を受け付けていません。 この質問を改善したいですか? 質問を更新することがありますので、話題のスタックオーバーフローのため。 8年前に閉鎖されました。 この質問を改善する コンピューターにIntelMPIベンチマークをインストールしようとしましたが、次のエラーが発生しました。 fork: retry: Resource temporarily unavailable その後、実行lsしてtopコマンドを実行すると、このエラーが再び発生しました。 このエラーの原因は何ですか? 私のマシンの構成: Dell precision T7500 Scientific Linux release 6.2 (Carbon)
80 linux  fork  mpi  intel 

1
sqrtsd命令のレイテンシが入力に基づいて変化するのはなぜですか?Intelプロセッサ
まあ上でインテル固有のガイドには、「sqrtsd」と呼ばれる命令は18サイクルのレイテンシーを持っていることが述べられています。 私はそれを自分のプログラムでテストしました。たとえば、0.15を入力として受け取った場合は正しいです。しかし、256(または任意の2 ^ x)の数をとると、レイテンシはわずか13になります。なぜですか? 私が持っていた1つの理論は、13は「sqrtss」のレイテンシであり、「sqrtsd」と同じですが32ビット浮動小数点で行われるため、プロセッサは256ビットが32ビットに適合し、そのバージョンを使用することを理解するのに十分スマートであるということです一方、0.15は有限の方法で表現できないため、完全な64ビットが必要です。 私はインラインアセンブリを使用してそれをやっています、これはgcc -O3と-fno-tree-vectorizeでコンパイルされた関連部分です。 static double sqrtsd (double x) { double r; __asm__ ("sqrtsd %1, %0" : "=x" (r) : "x" (x)); return r; }

1
vzeroallゼロはymm16からymm31を登録しますか?
のドキュメントにvzeroall一貫性がないようです。散文は言う: 命令は、すべてのXMMまたはYMMレジスタの内容をゼロにします。 ただし、その下の疑似コードは、64ビットモードではレジスターymm0からのみymm15影響を受けることを示しています。 IF (64-bit mode) limit ←15 ELSE limit ← 7 FOR i in 0 .. limit: simd_reg_file[i][MAXVL-1:0] ← 0 AVX-512をサポートするマシンymm15では、ymm16までymm31存在するため、「すべて」をクリアするのと同じではありません。 散文または疑似コードは正しいですか?
8 assembly  x86  intel  avx  avx512 
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.