Vous ne trouvez pas de réponse à votre problème ? Alors posez la question dans le forum. Souvenez-vous qu'il n'y a jamais de question bête, mais rester dans l'ignorance parce que l'on n'ose pas poser une question, ça c'est une erreur !

Sujet : Avertissement compilo [ Processeurs / X86 ] (NairodDorian)

vendredi 8 août 2008 à 22:32:05 | Avertissement compilo

NairodDorian

Bonjour,

J'ai écris un programme qui contient une fonction en full asm pour avoir les meilleurs perfs.
Voici le code de la fonction :

[CODE]

__declspec

(align(16)) double tab1[4], tab2[4];

__declspec

(naked) double sincosadd_asm() {
__declspec(align(16)) double r;
__asm {
movapd xmm0, qword ptr[tab1]
addpd xmm0, qword ptr[tab2]
movapd xmm1, qword ptr[tab1 + 16]
addpd xmm1, qword ptr[tab2 + 16]
addpd xmm0, xmm1
movsd xmm2, xmm0
unpckhpd xmm0, xmm0
addsd xmm2, xmm0
movsd qword ptr[r], xmm2
fld qword ptr[r]
ret
}
}

[/CODE]

Je compile avec Intel C++ et il m'affiche des avertissements sur ce code du genre :
warning #1980: bad memvx128 qualifier -- __asm movapd

J'ai donc réecris la fonction en C++

[CODE]

double

sincosadd() {
__declspec(align(16)) double t[4];
for
(DWORD i = 0; i < 4; ++i)
t[i] = tab1[i] + tab2[i];
return t[0] + t[1] + t[2] + t[3];
}

[/CODE]

Et regardé l'ASM qu'il génère :

push      ebp                                           ;21.20
        mov       ebp, esp                                      ;21.20
        and       esp, -16                                      ;21.20
        sub       esp, 16                                       ;21.20
$LN65:
        movaps    xmm0, XMMWORD PTR
?tab1@@3PANA                ;24.10
$LN67:
        addpd     xmm0, XMMWORD PTR
?tab2@@3PANA                ;24.20
$LN69:
        movaps    xmm1, XMMWORD PTR
?tab1@@3PANA+16             ;24.10
$LN71:
        addpd     xmm1, XMMWORD PTR
?tab2@@3PANA+16             ;24.20
$LN73:
        movaps    xmm2, xmm0                                    ;24.3
$LN75:
        unpckhpd  xmm0, xmm0                                    ;25.30
$LN77:
$LN79:
$LN81:
        addsd     xmm2, xmm0                                    ;25.16
$LN83:
        addsd     xmm2, xmm1                                    ;25.23
$LN85:
        unpckhpd  xmm1, xmm1                                    ;25.30
        addsd     xmm2, xmm1                                    ;25.30
        movsd     QWORD PTR [esp], xmm2                         ;25.30
        fld       QWORD PTR [esp]                               ;25.30
        mov       esp, ebp                                      ;25.30
        pop       ebp                                           ;25.30
        ret                                                     ;25.30
        ALIGN     2

Je n'ai pas l'impression que movaps soit la bonne instruction puisque je manipule des flottants double précision et que movaps c'est pour copier des flottants simple précision alors que l'instruction qui suit est addpd (ajouté paquet de flottant double précision).

Bref tout ça pour vous demander, pensez vous comme moi que le compilo pête les plombs pour m'avertir que je n'utilise pas correctement les bonnes instructions alors qu'a en regardé son code ce qu'il génère n'est guère mieux et même pire?




Cette discussion est classé dans : code, ptr, qword, xmm1, xmm0


Répondre à ce message

Sujets en rapport avec ce message

Instruction optimale ? [ par juju12 ] Bonjour;   Je code un bout d'asm inline sous C++ en utilisant les instructions SSE et des données alignées sur 16 octets.J'aurais voulu savoir, des de Récupération des flags du processeur [ par Oeil_de_taupe ] Bonjour,J'ai essayé, après avoir lu beaucoup de théorie sur l'assembleur sur X86, de faire un programme qui utilise les flags d'information du process AT&T erreur de compilation etc... [ par maminovadu75 ] Bonjour, j'aimerais me mettre a l'assembleur mais j'ai quelque problème.voici mon code morceau de code pour trier un tableau de int : ( mélange de C/C 5 Erreurs à trouver [ par bizzard4 ] Bonjour !J'explique le contexte. Un de mes professeurs ma donné comme défi de trouver les 5 erreurs dans le code ASM suivant. Je sais qu'il l'a trouvé Simulet un Alt Entrée [ par Joky ] Salut tous, donc voilà, j'suis nouveau en asmJ'ai un vieux projet à faire pour l'école en pascal :) héhé ( un sudoku :s )Et je voudrais donc lancer l' Plantage incomprehensible [ par Luong ] Bonjour tout le monde,Voila un petit bout de code qui genere un beau plantage sur mon ordi (memory could not be written) sans que je comprenne vraimen Invoke et Call [ par Micro_and_Macro ] Bonjour Voilà je débute en asm(masm32) et j'expérimente, mais là je flanche :-)Pourquoi ces 2 codes ne donnent -il pas la mêm chose?1er code.code DLL et Code Segment [ par Taron31 ] Bonjour, j'ai une question peut-être un peu étrange : en effet, je voudrais savoir si tout le code d'une DLL (par exemple NtDll.dll) est situé dans un Boot et heure [ par henri12 ] je fais un essai de changement de l heure avec l interruption 21h sous le boot l heure n est pas changerpourquoi.286C   ;Code de bootsecteur permettan ebx et interface C/C++ [ par kaervas ] Bonjour, pourquoi ne pas modifier la valeur du registre %ebx dans une interface en C/C++? En effet, j'ai code plusieurs fonctions dans des .o, que j'u


Nos sponsors

Sondage...

CalendriCode

Janvier 2009
LMMJVSD
   1234
567891011
12131415161718
19202122232425
262728293031 

Consulter la suite du CalendriCode

Téléchargements

Logiciels à télécharger sur le même thème :



Développement réalisé par Nicolas SOREL (Nix) avec l'aide de : Cyril DURAND et Emmanuel BAÏSE, Merci à Vincent pour ses précieux conseils
CodeS-SourceS.com© Toute reproduction même partielle est interdite sauf accord écrit du Webmaster
CodeS-SourceS.com© est une marque déposée tous droits réservés
Temps d'éxécution de la page : 2,200 sec

Google Coop CodeS-SourceS Google Coop CodeS-SourceS


Certaines images présentes sur le site (notament certains avatars) sont issues des collections IconShock, donc si vous souhaitez utiliser ces icons vous devez les acheter, ne les copiez pas et ne utilisez pas dans vos sites et applications sans les avoir commandé.