AMD Piledriver болон K10: Толгойгоороо. Шинэ AMD процессорууд

2000-аад оны эхэн үеийн нээлтийн дараа AMD аюулгүйгээр буцаж ирэв хэвийн байдалүргэлж гүйцэж, хэдий ч нэлээд сонирхолтой, эргэлзээгүй дэвшилтэт техникийн шийдлүүд, борлуулалтаараа Intel-тэй өрсөлдөхийг оролддоггүй. 2009 оны дунд үеийн байдлаар тус компанийн хувь хэмжээ микропроцессорын зах зээлийн 14.5 орчим хувийг эзэлж байна. Үүний зэрэгцээ, нэгэн цагт AMD чипүүдийн өмчлөлийн "онцлогууд" - жишээлбэл, 64 битийн зааврын өргөтгөлүүд эсвэл процессорт суурилуулсан хянагч. санамсаргүй хандалт санах ой- гол өрсөлдөгчийн чипүүдэд удаан хугацаагаар ашиглагдаж ирсэн.

Өнөөдөр AMD-ийн бүтээгдэхүүнүүд маш нарийн хоёр цэгийг эзэлдэг: эдийн засгийн зэрэглэлийн компьютер бүтээхэд зориулагдсан хэт төсөвт процессорууд болон харьцуулсан Intel чипээс 3-5 дахин хямд үнэтэй өндөр хүчин чадалтай загварууд.

Энэ нь дэлгүүрийн тавиур дээр янз бүрийн гэр бүл, үеийн AMD процессоруудыг олж болно гэдгийг тайлбарлаж байна - эртний үеийн Sempron, Athlon, Socket 939 залгуурт зориулсан K8 архитектурт суурилсан хэт орчин үеийн зургаан цөмт Phenom II X6 хүртэл. Гэсэн хэдий ч AMD одоо K10 архитектурт найдаж байгаа тул бид түүний үндсэн дээр боловсруулсан процессоруудын талаар тусгайлан ярих болно. Үүнд Phenom болон Phenom II, түүнчлэн Athlon II гэж нэрлэгддэг төсвийн хувилбарууд багтана.

Түүхээс харахад K10-д суурилсан анхны чипүүд нь 2007 оны 11-р сард гарсан дөрвөлсөн цөмт Phenom X4 (код нэртэй Agena) байв. Хэсэг хугацааны дараа буюу 2008 оны 4-р сард гурван цөмт Phenom X3 гарч ирэв - дэлхийн анхны төв процессорууд. ширээний компьютерууд, гурван цөм нь нэг чип дээр байрладаг. 2008 оны 12-р сард 45 нанометрийн процессын технологид шилжсэнээр шинэчлэгдсэн Phenom II гэр бүлийг нэвтрүүлж, 2-р сард чипүүд нь шинэ Socket AM3 холбогчтой болсон. Дөрвөн цөмт Phenom II X4 2009 оны 1-р сард, гурвалсан цөмт Phenom II X3 2009 оны 2-р сард, хоёр цөмт Phenom II X2 2009 оны 6-р сард, 6 цөмт Phenom II X2 дөнгөж саяхан буюу 4-р сард цуврал үйлдвэрлэгдэж эхэлсэн. 2010 он.

Athlon II - Sempron-ийн орчин үеийн орлуулалт нь Phenom II бөгөөд хамгийн чухал давуу талуудын нэг болох гурав дахь түвшний том кэш (L3), бүх цөмд нийтлэг байдаг. Хоёр, гурав, дөрвөн цөмт хувилбартай. Athlon II X2 нь 2009 оны 6-р сараас, X4 нь 2009 оны 9-р сараас, X3 нь 2009 оны 11-р сараас эхлэн үйлдвэрлэгдэж байна.

AMD K10 архитектур

K10 болон K8 архитектурын үндсэн ялгаа нь юу вэ? Юуны өмнө K10 процессоруудад бүх цөм нь нэг чип дээр хийгдсэн бөгөөд тусгай L2 кэшээр тоноглогдсон байдаг. Phenom/Phenom 2 болон серверийн Opteron чипүүд нь бүх цөмд зориулсан нийтлэг L3 кэш санах ойг хангадаг бөгөөд хэмжээ нь 2-6 МБ хооронд хэлбэлздэг.

K10-ийн хоёр дахь гол давуу тал бол 32 битийн горимд хоёр чиглэлд 41,6 ГБ/с хүртэл хурдтай, 16 битийн горимд нэг чиглэлд 10,4 ГБ/с хүртэл хурдтай, давтамжтай шинэ HyperTransport 3.0 системийн автобус юм. 2.6 GHz хүртэл. Хамгийн их ажиллах давтамж гэдгийг санаарай өмнөх хувилбар HyperTransport 2.0 нь 1.4 GHz, хамгийн дээд хурд нь 22.4 буюу 5.6 ГБ/сек хүртэл байна.

Өргөн автобус нь олон цөмт процессоруудад онцгой ач холбогдолтой бөгөөд HyperTransport 3.0 нь сувгийн тохиргоог хангаж, цөм бүр өөрийн бие даасан эгнээтэй байх боломжийг олгодог. Нэмж дурдахад K10 процессор нь автобусны өргөн ба ажиллах давтамжийг өөрийн давтамжтай пропорциональ динамикаар өөрчлөх чадвартай.

Одоогоор AMD чип дээр HyperTransport 3.0 автобус нь зөвшөөрөгдөх дээд хэмжээнээс хамаагүй бага хурдтай ажиллаж байгааг тэмдэглэх нь зүйтэй. Загвараас хамааран 1.6 GHz ба 6.4 ГБ/с, 1.8 ГГц ба 7.2 ГБ/с, 2 ГГц ба 8.0 ГБ/с гэсэн гурван горимыг ашигладаг. Үйлдвэрлэсэн чипүүд нь 2.4 GHz ба 9.6 ГБ/с, 2.6 ГГц ба 10.4 ГБ/с гэсэн хоёр стандарт горимыг хараахан ашиглаагүй байна.

K10 процессорууд нь бие даасан хоёр RAM хянагчийг нэгтгэдэг бөгөөд энэ нь бодит үйл ажиллагааны нөхцөлд модулиудад хандах хандалтыг хурдасгадаг. Удирдлагууд нь DDR2-1066 санах ойтой (AM2+ ба AM3 залгуурт зориулсан загварууд) эсвэл DDR3 (AM3 залгуурт зориулсан чип) ажиллах чадвартай. Socket AM3-д зориулсан Phenom II ба Athlon II-д нэгтгэгдсэн хянагч нь хоёр төрлийн RAM-г дэмждэг бөгөөд AM3 залгуур нь AM2+-тэй хойшоо нийцдэг тул шинэ CPU-үүдийг хуучин AM2+ хавтан дээр суулгаж, DDR2 санах ойтой ажиллах боломжтой. Энэ нь Phenom II-г шинэчлэхийн тулд худалдаж авахдаа эх хавтанг шууд солих эсвэл өөр төрлийн RAM худалдаж авах шаардлагагүй болно, жишээ нь Intel i3/i5/i7 чиптэй адил.

K10 архитектуртай микропроцессорууд нь AMD Cool"n"Quiet, CoolCore, Independent Dynamic Core, Dual Dynamic Power Management зэрэг орчин үеийн эрчим хүчний хэмнэлттэй технологийг бүхэлд нь хэрэгжүүлдэг. Энэ нарийн төвөгтэй системСул зогсолтын горимд бүхэл чипийн эрчим хүчний хэрэглээг автоматаар бууруулах, санах ойн хянагч болон цөмийн бие даасан тэжээлийн удирдлагыг хангах, ашиглагдаагүй процессорын элементүүдийг унтраах чадвартай.


Эцэст нь, цөм нь өөрөө ч мэдэгдэхүйц сайжирсан. Дээж авах, салбар, салбарыг урьдчилан таамаглах, диспетчерийн хэсгүүдийн дизайныг шинэчилсэн бөгөөд энэ нь үндсэн ачааллыг оновчтой болгох, эцсийн дүндээ гүйцэтгэлийг сайжруулах боломжтой болсон. SSE блокуудын өргөнийг 64 битээс 128 бит болгон нэмэгдүүлж, 64 битийн зааврыг нэг болгон гүйцэтгэх боломжтой болж, хоёр нэмэлт SSE4a зааврын дэмжлэгийг нэмсэн (процессорын SSE4.1 ба 4.2 зааврын багцтай андуурч болохгүй). Intel Core).

Opterons (код нэртэй Барселона) сервер болон Phenom X4 ба X3-ийн анхны хувилбаруудад илэрсэн дизайны согогийг дурдах хэрэгтэй - "TLB алдаа" гэж нэрлэгддэг бөгөөд энэ нь нэгэн зэрэг бүх төрлийн нийлүүлэлтийг бүрэн зогсооход хүргэсэн. В2 хувилбарын оптеронууд. Маш ховор тохиолдолд, өндөр ачаалалтай үед L3 кэш TLD блокийн дизайны алдаанаас болж систем тогтворгүй, урьдчилан таамаглах боломжгүй байдаг. Энэ согог нь серверийн системд маш чухал гэж үзсэн тул бүх гаргасан Opterons-ийн тээвэрлэлтийг түр зогсоосон. Desktop Phenoms-д зориулсан тусгай нөхөөсийг гаргасан бөгөөд энэ нь BIOS ашиглан гэмтэлтэй блокыг идэвхгүй болгосон боловч процессорын гүйцэтгэл мэдэгдэхүйц буурсан байна. B3 хувилбар руу шилжсэнээр асуудал бүрэн арилсан бөгөөд ийм чипүүд удаан хугацаанд худалдаанд гараагүй байна.

Одоогийн загварын хүрээ

Хэдийгээр AMD-н шилдэг процессорууд нь Intel-ийн шилдэг загваруудаас эрс доогуур боловч олон тооны үйлдвэрлэсэн хоёр ба дөрвөлсөн цөмт чипүүдийн сегментэд тодорхой хэмжээний паритет удаан хугацаанд хадгалагдан үлджээ. Үүний зэрэгцээ, AMD платформ нь өөрөө мэдэгдэхүйц хямд байдаг - зөвхөн процессор өөрөө төдийгүй эх хавтангийн өртөг багатай байдаг. Хэрэв та Phenom II X3 ба X4 дээрх төсөвт машинуудыг Core i3 дээр суурилсан, арай илүү бүтээмжтэй, гэхдээ бараг хоёр дахин үнэтэй компьютеруудтай харьцуулж үзвэл энэ ялгаа мэдэгдэхүйц байх болно. Хэрэв та илүү их хүчийг золиосолж, Athlon II-г сонговол компьютер нь хагасаас илүү үнэтэй байх болно!

Илүү бүтээмжтэй машинуудын хувьд зөвхөн хамгийн хүчирхэг машинууд нь Core i5-тай өрсөлдөх боломжтой хүчирхэг загварууд Phenom II X4 болон хамгийн сүүлийн үеийн зургаан цөмт X6-г зөвхөн хамгийн залуу дөрвөлсөн цөмт Core i7-тэй зөв харьцуулж болно.

Бүх үйлдвэрлэсэн Athlon II ба Phenom II нь Socket AM2+-д суулгасан, зөвхөн DDR2 RAM-тай ажилладаг Phenom II X4 940 ба 920 гэсэн хоёр загвараас бусад нь AM3 залгуурт суурилуулах зориулалттай. Phenom чипүүд нь зөвхөн AM2 залгуурт зориулагдсан. AM2+ залгуурт зориулсан процессорыг AM3 залгуурт суулгах боломжгүй, гэхдээ дээр дурдсанчлан AM3 чипийг AM2+ залгууртай хавтан дээр суулгаж болно.

AMD нь Socket AM2-д зориулсан чипүүдийг аажмаар хасаж байгаа бөгөөд Intel-тэй адил илүү орчин үеийн DDR3 RAM дэмждэг загваруудад найдаж байгаа бололтой. Цагийн давтамж болон бусад шинж чанараараа ижил төстэй AM3 ба AM2+ загварууд нь бараг ижил үнэтэй бөгөөд хэрэв та шинэ чипүүдийн хоцрогдсон нийцтэй байдлыг харгалзан үзвэл анхны Phenoms худалдаж авах нь тийм ч чухал биш юм. Тиймээс ирээдүйд бид зөвхөн Phenom II ба Athlon II-ийг авч үзэх болно.

Athlon II болон Phenom II хоёулаа хоёр, гурав, дөрвөн цөмт хувилбарууд (X2, X3, X4), мөн "phenoms" нь зургаан цөмт хувилбарт байдаг. Өөрчлөлт хийх боломжтой Хар хэвлэл, стандартаас онгойлгосон үржүүлэгчээр ялгаатай бөгөөд энэ нь overclocking-ийг хялбаршуулдаг.

Харамсалтай нь ихэнх шинэ AMD чипүүд нь ижил төстэй шинж чанартай Intel загваруудаас дулааны багцын хувьд дахин доогуур байгаа нь хөргөлтийн системд илүү их шаардлага тавьж, эрчим хүчний хэрэглээг нэмэгдүүлдэг гэсэн үг юм. Олон цөмт Phenom II-ийн хувьд ердийн TDP нь 80, 95 эсвэл 125 Вт байна. Загварын индексийн дараа "e" үсэг бүхий тусгай хэмнэлттэй (65 Вт) өөрчлөлтүүд зарагддаг боловч "ердийн" сонголтуудаас мэдэгдэхүйц удаан бөгөөд илүү үнэтэй байдаг.

Athlon II X2 процессорууд нь Phenom II X2 шиг хоёр үхсэн цөмтэй дөрвөн цөмт чип биш харин "жинхэнэ" хоёр цөмт чип юм. Гэхдээ Athlon II X3 бол нэг ажиллагаагүй цөмтэй Athlon II X4 юм. Бүх Athlon II-ийг 45 нм технологи ашиглан үйлдвэрлэдэг.

Athlone X2, X3, X4-ийн цөм бүр нь 128 KB L1 кэш, 512 KB хоёр дахь түвшний кэшээр тоноглогдсон. Гэсэн хэдий ч, Phenom II-ээс ялгаатай нь тэд L3 кэшийг хуваалцдаггүй бөгөөд энэ нь процессорууд илүү удаан кэш рүү хандах болно гэсэн үг юм. системийн санах ой. Үүний үр дүнд нөөц их шаарддаг программуудын гүйцэтгэл хязгаарлагдмал байдаг гурван хэмжээст графикТэгээд Компьютер тоглоом. Гэсэн хэдий ч сайн видео карттай хослуулан Athlon II системүүд нь нэлээд сайн тоглоомын гүйцэтгэлийг харуулдаг.

Phenom II нь Core i3 болон i5-ийн хүчтэй өрсөлдөөнтэй тулгардаг ч тэд харьцуулж болохуйц системийн өртөгийг давсан нь гарцаагүй. Athlon II-ийн нэгэн адил феномын цөм бүр нь 128 КБ L1 кэш, 512 КБ L2 кэштэй. Үүний зэрэгцээ Phenom II нь бүх цөмд нийтлэг байдаг гурав дахь түвшний кэш санах ойг өгдөг. Бараг бүх "үзэгдэл" - хоёр, гурав, дөрөв, зургаан цөмт нь 6 МБ L3 кэштэй бөгөөд 805, 810, 820 индекстэй гурван залуу X4 загвараас бусад нь ердөө 4 МБ L3 L3 санах ойтой. .

Өгүүллийн хоёрдугаар хэсэгт бид танд товч танилцуулах болно суурь мэдээлэлгол зүйлийн талаар техникийн үзүүлэлтОдоогийн байдлаар үйлдвэрлэсэн AMD Athlon II ба Phenom II процессоруудыг Оросын дэлгүүрүүдэд жижиглэнгийн үнээр тооцсон болно. Эцэст нь хэлэхэд бид анхаарлаа хандуулах ёстой хамгийн сонирхолтой загваруудын талаар ярих болно Онцгой анхааралсонгохдоо.

Есдүгээр сарын эхээр AMD компанидөрвөлсөн цөмт K10 архитектурын шинэ процессоруудаа танилцуулахаа амлаж байна. Эдгээр шинэ архитектуртай анхны процессорууд нь Барселона кодтой үндсэн дээр Opteron серверийн чипүүд байх болно. Харамсалтай нь AMD-ийн инженерүүд одоогийн хувилбарт өндөр давтамжтай ажилладаг процессоруудыг олноор нь үйлдвэрлэх боломжгүй байсан. Давтамжийг нэмэгдүүлэхэд тулгарч буй гол бэрхшээл нь өндөр давтамжийн дөрвөн цөм нь платформын дулааны багцад заасан хэмжээнээс давсан эрчим хүч хэрэглэдэг явдал байв. Шинэ хувилбарууд гарч, илүү боловсронгуй техникийн процесст шилжих үед эрчим хүчний хэрэглээ буурч, давтамж нэмэгдэх болно. Энэ хооронд AMD нь эдийн засгийн хүнд байдлаас гарахын тулд борлуулалтаа яаралтай эхлүүлэх шаардлагатай байгаа тул Барселоныг нийлүүлэлт нь 2 ГГц давтамжтай серверийн дөрвөлсөн цөмт процессороор эхлэх болно.

2007 оны 4-р улиралд AMD нь Opteron давтамжийг 2.4-2.5 GHz хүртэл нэмэгдүүлж, K10 архитектурын процессоруудын ширээний хувилбаруудыг гаргахаа амлаж байна.

Phenom FX (кодын нэр Agena FX) – 4 цөм, 2 MB L3 кэш, 2.2–2.4 GHz, AM2+ ба F+ залгууруудын тооцоолсон эхлэх давтамж;
Phenom X4 (кодын нэр Agena) – 4 цөм, 2 MB L3 кэш, 2.2–2.4 GHz-ийн тооцоолсон эхлэх давтамж, AM2+ залгуур.

Хожим нь 2008 оны эхээр AMD шинэ процессоруудын хялбаршуулсан хувилбаруудыг нэвтрүүлэхээ амлаж байна.

Phenom X2 (кодын нэр Кума) – 2 цөм, 2 MB L3 кэш, тооцоолсон эхлэх давтамж 2.2–2.6 GHz, залгуур AM2+;
Athlon X2 (кодын нэр Рана) – 2 цөм, L3 кэшгүй, тооцоолсон эхлэх давтамж 2.2 GHz, AM2+ залгуур;
Sempron (код нэр Spica) – 1 цөм, тооцоолсон эхлэх давтамж 2.2–2.4 GHz, AM2+ залгуур.

Гэхдээ энэ бүхэн ойрын ирээдүйн асуудал боловч энэ хооронд AMD-ийн шинэ архитектур ямар шинэлэг зүйл авчирсныг харцгаая. Энэ нийтлэлд би түүний нарийн ширийн зүйлийг нарийвчлан гаргаж, үүнээс юу хүлээж болохыг үнэлэхийг хичээх болно.

Татаж авах заавар

Процессорын кодын гүйцэтгэл нь L1I зааврын кэшээс заавар авч, кодыг нь тайлах замаар эхэлдэг. x86 заавар нь хувьсах урттай тул кодыг тайлахаас өмнө тэдгээрийн хил хязгаарыг тодорхойлоход хэцүү болгодог. Зааврын уртыг тодорхойлох нь код тайлах хурдад нөлөөлөхгүй байхын тулд K8/K10 процессорууд L1I зааврын кэш рүү мөрүүдийг ачаалах үед зааварчилгааг урьдчилан тайлах ажлыг гүйцэтгэдэг. Зааврын байршлын талаарх мэдээллийг L1I кэшэд тусгай талбарт (зааврын байт бүрт 3 битийн код тайлахын өмнөх мэдээлэл) хадгалдаг. Кэш рүү ачаалах үед кодыг урьдчилан тайлах нь зааврын хил хязгаарыг тодорхойлох нэмэлт ачааллыг код тайлах сувгуудаас гадуур зөөж, зааврын урт, бүтцээс үл хамааран тайлах хурдыг тогтмол байлгах боломжийг олгодог.

Процессорууд зааврыг кэшээс блок болгон ачаалж, тэдгээрээс зааврыг гаргаж аваад код тайлахаар илгээдэг. K10 архитектурын процессор нь L1I зааврын кэшээс зааврыг 16 байт блокоор татдаг K8 болон Intel Core 2 процессоруудаас ялгаатай нь 32 байт блокуудад тохируулан авдаг. Цаг тутамд 16 байт түүвэрлэлтийн хурд нь K8 болон Core 2 нь цагийн мөчлөг бүрт код тайлахын тулд дунджаар 5 байт хүртэлх таван заавар илгээх боломжийг олгодог. Гэсэн хэдий ч x86 командын урт нь 16 байт хүрч болох ба зарим алгоритмд гинжин хэлхээний хэд хэдэн зэргэлдээх зааврын урт нь 5 байтаас хэтрэх боломжтой бөгөөд энэ нь ийм тохиолдолд нэг цагийн мөчлөгийн гурван зааврыг тайлах боломжгүй болгодог (Зураг 1).


Цагаан будаа. 1. Хэд хэдэн зэргэлдээх урт командууд хурдыг хязгаарладаг
16 байт блокоор түүвэрлэх үед код тайлах


Ялангуяа SSE2-ийн урт нь бүртгэлээс бүртгүүлэх операндуудтай энгийн заавар юм (жишээлбэл, movapd xmm0, xmm1) - 4 байт. Гэсэн хэдий ч, санах ойн хаягийн үйлдлийг ашиглахдаа зааварт үндсэн бүртгэл ба офсет ашиглан (жишээлбэл, movapdxmm0,) командын урт нь офсетээс хамаарч 6-9 байт хүртэл нэмэгддэг. 64 битийн горимд нэмэлт регистр ашиглах үед зааврын кодонд өөр нэг байт REX угтвар нэмэгдэнэ. Тиймээс 64 битийн горимд SSE2 командын урт 7-10 байт хүрч болно. SSE1 командын урт нь вектор заавар (өөрөөр хэлбэл 4-өөс дээш 32 битийн утга) бол 1 байтаар бага боловч скаляр (нэг операнд гаруй) SSE1 заавар нь мөн адил дор 7-10 байт урттай байж болно. нөхцөл.

Цагийн цикл тутамд 16 байт авах нь K8 процессорын хувьд энэ нөхцөл байдалд хязгаарлалт биш юм, учир нь энэ нь 2 цагийн цикл тутамд 3-аас дээш давтамжтайгаар вектор SSE зааврыг тайлж чадахгүй хэвээр байгаа боловч K10 архитектурын хувьд 16 байт түүвэрлэлт болж магадгүй юм. хязгаарлалт тул түүвэрлэлтийн өргөнийг цаг тутамд 32 байт хүртэл өргөжүүлэх нь боломжийн шийдэл юм.

Дашрамд хэлэхэд, Core 2 процессорууд нь K8 процессоруудын нэгэн адил 16 байт блокуудад заавруудыг татаж авдаг тул зааврын дундаж урт нь 4 байтаас хэтрэхгүй тохиолдолд л зааварчилгааны урсгалыг цагт 4 хурдтайгаар үр дүнтэй тайлж чаддаг. нэг цагийн мөчлөгт зөвхөн 4 төдийгүй 3 зааврыг үр дүнтэй боловсруулах боломжгүй болно. Гэсэн хэдий ч Core 2 нь тусгай дотоод 64 байт буфертэй бөгөөд сүүлийн дөрвөн 16 байт блокыг хадгалдаг. Энэ буферээс татан авалтыг нэг цагийн мөчлөгт 32 байт хурдаар гүйцэтгэдэг. Энэхүү буфер нь богино мөчлөгийг кэш хийх, тэдгээрийн түүвэрлэлтийн хурдны хязгаарлалтыг арилгах, мөн мөчлөгийн эхэнд шилжих шилжилтийн таамаглал бүрт 1 цагийн циклийг хэмнэх боломжийг олгодог. Гэсэн хэдий ч гогцоонууд нь 18-аас илүүгүй заавар, 4-өөс илүү болзолт салбар, ret зааваргүй байх ёстой..

Шилжилтийн таамаглал

Командын урсгалд салбарууд гарч ирэхэд процессор нь код тайлалтыг тасалдуулахгүйн тулд програмын цаашдын үйл ажиллагааг таахыг оролдож, хамгийн их магадлалтай салбараас үргэлжлүүлэн тайлах ёстой. Ийм тохиолдолд салбарыг таамаглах механизмыг ашиглан дараагийн зааврын блокыг татаж авдаг. K8 процессор дахь салбаруудын таамаглалыг дасан зохицох хоёр түвшний алгоритм ашиглан гүйцэтгэдэг бөгөөд энэ нь зөвхөн одоогийн заавар төдийгүй өмнөх 8 зааврын салбарын түүхийг харгалзан үздэг. K8 салбарыг урьдчилан таамаглах механизмын гол дутагдал нь динамик байдлаар холбосон хаягтай шууд бус салбаруудыг урьдчилан таамаглаагүй явдал байв.

Шууд бус шилжилтүүд нь програмын кодыг гүйцэтгэх үед динамикаар тооцдог заагч ашиглан хийгддэг шилжилтүүд юм. Ихэвчлэн шууд бус үсрэлтүүдийг хөрвүүлэгчид шилжүүлэгч кейсийн бүтцэд оруулдаг бөгөөд мөн объект хандалтат програмчлалын функцийг хаягаар болон виртуал функцүүдийн дуудлагад ашигладаг. K8 процессор нь хамгийн сүүлийн салбар хаягаас код авахыг үргэлж оролддог. Хэрэв хаяг өөрчлөгдсөн бол дамжуулах хоолойг дахин тохируулна. Хэрэв үсрэлтийн хаягийг үе үе холбодог бол процессор байнга алдаа гаргадаг. Шууд бус үсрэлтүүдийн динамикаар өөрчлөгдөж буй хаягийг урьдчилан таамаглах механизм анх Pentium M процессор дээр гарч ирсэн.K8-д ийм механизм байхгүй байгаа нь объект хандалтат код дээр түүний үр нөлөөг бууруулдаг.

Хүлээгдэж буйгаар K10 дахь нөхцөлт салбаруудын таамаглал сайжирсан:

512 элементийн хүснэгтээс урьдчилан таамагласан шууд бус шилжилтийн динамикаар өөрчлөгдөж буй хаягийг урьдчилан таамаглах механизм гарч ирэв.
Өмнөх үсрэх заавруудын дарааллын түүхийг тодорхойлоход ашигладаг дэлхийн түүхийн бүртгэлийн хэмжээг 8-аас 12 бит болгон нэмэгдүүлсэн.
Буцах стекийн гүнийг 12-оос 24 элемент болгон нэмэгдүүлсэн бөгөөд энэ нь функцээс буцах хаягийг хурдан тодорхойлоход хэрэглэгддэг бөгөөд ингэснээр буцах хаягийг стекээс авахын тулд ret командыг хүлээхгүйгээр үргэлжлүүлэн дуудаж болно.

Эдгээр сайжруулалтын ачаар K10 нь өндөр түвшний объект хандалтат хэл дээр бичигдсэн програмуудын гүйцэтгэлийн хурдыг мэдэгдэхүйц нэмэгдүүлэх ёстой. Харамсалтай нь K10 салбарыг урьдчилан таамаглах нэгжийн үр ашгийг бодитойгоор үнэлэх нь нэлээд хэцүү боловч зарим мэдээллээр энэ нь зарим тохиолдолд Intel процессоруудаас доогуур байж болно.

Код тайлах

Зааврын кэшээс хүлээн авсан блокуудыг код тайлах буфер руу хуулдаг ( Урьдчилан кодлох/Буфер сонгох), зааврыг блокуудаас тусгаарласан тохиолдолд тэдгээрийн төрлийг тодорхойлж, холбогдох декодерын суваг руу илгээдэг. Нэг (Ганц) эсвэл хоёр (Давхар) макро үйлдэл болгон задалсан энгийн зааварчилгааг "энгийн" декодлогч руу илгээдэг. Шууд зам. 3 ба түүнээс дээш макро үйлдэлд тайлагдсан нарийн төвөгтэй заавруудыг программ хангамжийн код тайлагч руу илгээдэг. VectorPath.


Цагаан будаа. 2. Декодер


Цагийн мөчлөг бүрт декодерын сувгуудаас 3 макро ажиллагаа (MOP) гарч болно. DirectPath декодлогч нь нэг цагийн мөчлөгт 3 энгийн 1-MOP заавар, эсвэл нэг 2-MOP ба нэг 1-MOP, эсвэл нэг ба хагас 2-MOP зааврыг (хоёр цагийн мөчлөгт гурван 2-MOP зааврыг) тайлж чадна. Нарийн төвөгтэй зааврыг 3-аас дээш MOP-д тайлж болох тул ийм зааврыг тайлах нь хэд хэдэн цагийн мөчлөгийн турш үргэлжилж болно. Декодерын сувгуудын гаралт дээр зөрчил үүсгэхгүйн тулд K8 ба K10 дахь энгийн бөгөөд нарийн төвөгтэй зааврыг код тайлахаар нэгэн зэрэг илгээх боломжгүй.

MOP нь бүхэл тоо эсвэл бодит арифметикийн нэг бичил үйлдэл, санах ойд хандах нэг хаягийн бичил үйлдэл гэсэн хос бичил үйлдлийн системээс бүрдэнэ. MOP-аас бичил үйл ажиллагааг сонгох ажлыг төлөвлөгч гүйцэтгэдэг бөгөөд тэдгээрийг бие биенээсээ хамааралгүйгээр гүйцэтгэхээр илгээдэг.

Цагийн мөчлөг бүр дэх декодчилогчоос гарах MOS гаралтыг 3 бүлэгт нэгтгэдэг. DirectPath болон VectorPath командууд ээлжлэн солигдсон эсвэл код тайлах зааврыг дуудах янз бүрийн саатал зэргээс шалтгаалан декодчилогч дээр 2 эсвэл бүр ердөө 1 MOS агуулсан бүлэг үүсч болно. гаралт. Ийм бүлгийг гурван хүртэлх хоосон MOP-оор дүүргэж, энэ маягтыг гүйцэтгэхэд илгээдэг.

K8 процессор дахь SSE, SSE2, SSE3 вектор зааварчилгааг 64 битийн төхөөрөмж дээрх 128 битийн SSE бүртгэлийн дээд ба доод 64 битийн хагасыг тусад нь боловсруулдаг хос MOP-д хуваадаг. Энэ нь зааврын кодыг тайлах хурдыг хоёр дахин бууруулж, хуваарийн дараалалд орох зааврын тоог хоёр дахин бууруулдаг.

K10 процессор дахь FPU блокуудыг 128 бит хүртэл өргөжүүлсэн тул вектор SSE командуудыг хоёр MOP болгон хуваах шаардлагагүй болно. K8 дээр DirectPath Double гэж тайлагдсан ихэнх SSE зааварчилгааг 1 MOS дээр K10 дээр DirectPath Single гэж тайлж эхэлсэн. Нэмж дурдахад, K8 програмын VectorPath декодлогчоор дамжуулан тайлсан SSE зааврын нэг хэсгийг K10-д энгийн DirectPath декодлогчоор дамжуулан тайлж эхэлсэн бөгөөд үүссэн MOP-ийн тоог 1 эсвэл 2 MOP хүртэл бууруулж (үйл ажиллагаанаас хамааран) ).

Стектэй ажиллах бүхэл тоон зааврын кодыг тайлах ажлыг мөн хялбаршуулсан. CALL-RET болон PUSH-POP функцүүдийн дуудлагад ихэвчлэн хэрэглэгддэг стек зааврын ихэнх хэлбэрийг одоо энгийн декодчилогчоор нэг MOS болгон тайлж байна. Үүнээс гадна эдгээр командууд нь одоо тусгай схемийг ашиглаж байна Sideband Stack Optimizerзэрэгцээ гүйцэтгэх боломжтой макро үйлдлийн бие даасан гинжин хэлхээ болж хувирдаг.

Sideband Stack Optimizer

K10-д Sideband Stack Optimizer хэмээх тусгай блокыг декодерийн хэлхээнд нэмсэн. Үйл ажиллагааны зарчим нь Core процессоруудад хэрэглэгддэг шинэ Stack Pointer Tracker блоктой төстэй юм. Яагаад хэрэгтэй байна вэ? X86 командын багц нь CALL, RET, PUSH, POP командуудыг ашиглан функцийг дуудах, түүнээс гарах, түүнд параметр дамжуулах, регистрүүдийн агуулгыг хадгалахад ашигладаг. Эдгээр бүх заавар нь стекийн одоогийн байрлалыг заадаг ESP бүртгэлийг далд хэлбэрээр ашигладаг. Та K8-д функцийг дуудах үед эдгээр зааврууд хэрхэн биелэгдэж байгааг тэдгээрийн тайлалтыг стекийн бүртгэлийг өөрчлөх, ачаалах/хадгалахтай ижил төстэй энгийн үйлдлүүдийн дараалал гэж төсөөлж харж болно.


Энэ жишээнээс харахад функцийг дуудах үед командууд ESP бүртгэлийг дараалан өөрчилдөг тул команд бүр өмнөх үйлдлийн үр дүнгээс шууд хамаардаг. Энэ гинжин хэлхээний командуудыг дахин эрэмбэлэх боломжгүй тул mov eax, командаас эхлэн функцийн бие нь сүүлийн PUSH командыг гүйцэтгэх хүртэл биелэгдэж эхлэх боломжгүй. Sideband Stack Optimizer блок нь стекийн өөрчлөлтийг хянаж, стектэй холбоотой заавар бүрийн офсетийг тохируулж, стекийг тодорхой ашигладаг зааврын өмнө стекийн дээд талын синхрончлолын үйлдлүүдийг (синк-MOP) оруулах замаар гинжийг бие даасан блок болгон хувиргадаг. бүртгүүлэх. Энэ нь стекийг ашигладаг командуудыг дахин эрэмбэлэх хязгаарлалтыг арилгана.


Баг хөдөлж,, үүнээс тооцоолол нь функцийн биед эхэлдэг энэ жишээнд, зөвхөн стекийн дээд талд байгаа синхрончлолын үйлдлээс хамаарна. Одоо эдгээр үйлдлүүдийг өмнө нь байгаа бусад командуудтай зэрэгцүүлэн чөлөөтэй гүйцэтгэх боломжтой. Ийнхүү параметр дамжуулах, регистрийг хадгалах хурд нэмэгдэж, үүний зэрэгцээ функцын байгууллага нь бүх параметрүүдийг дамжуулж, бүртгэлийг хадгалахаас өмнө параметрүүдийг ачаалж, тэдгээртэй үйлдлүүдийг хийж эхлэх боломжтой.

Тиймээс стектэй ажиллах зааварчилгааг тайлах хурдыг нэмэгдүүлэх, Sideband Stack Optimizer блок ашиглах, буцах стекийн гүнийг нэмэгдүүлэх, K10 дахь шууд бус салбаруудыг урьдчилан таамаглах нь функцээр баялаг кодуудын гүйцэтгэлийн хурдыг мэдэгдэхүйц нэмэгдүүлэхэд хүргэдэг. дуудлага.

K10 процессорын декодчилогч нь Core 2 декодлогч нь таатай нөхцөлд хийж чаддаг шиг цагийн мөчлөг бүрт 4 зааврыг тайлж чадахгүй ч энэ нь программыг гүйцэтгэхэд хязгаарлах хүчин зүйл болохгүй. Командын гүйцэтгэлийн дундаж хурд бараг хэзээ ч нэг цагийн мөчлөгт 3 команд хүрдэггүй тул K10 декодер нь дараалалд ажиллахгүйн улмаас тооцоолох нэгжүүд сул зогсохгүй байхын тулд хангалттай үр дүнтэй байх болно.

Командын хяналтын хэсэг

Шифрлэгдсэн MOP гурвалсанууд нь зааварчилгааны хяналтын нэгжид (ICU) ордог бөгөөд энэ нь MOP-уудыг дахин эрэмбэлэх буферт (ROB) хадгалдаг. Дахин эрэмбэлэх буфер нь гурван MOP-ийн 24 мөрөөс бүрдэнэ. MOP гурвалсан бүр өөрийн мөрөнд бичигдсэн байдаг. Ийнхүү ROB нь хяналтын нэгжид 72 MOP-ыг тэтгэвэрт гарах хүртэл нь хянах боломжийг олгодог.

Дахин эрэмбэлэх буферээс MOP-ууд нь декодчилогчоос гарах дарааллаар бүхэл тоо болон бодит гүйцэтгэлийн нэгжийн хуваарьт дараалалд илгээгдэнэ. Бүх хуучин үйлдлүүдийг хийж дуусгах хүртэл MOP гурвалсан хэсгүүдийг дахин эрэмбэлэх буферт үргэлжлүүлэн хадгална. Тэтгэвэрт гарах үед эцсийн утгыг архитектурын бүртгэл, санах ойд бичдэг. Үйлдлүүдийг цуцлах, тэдгээрийн талаарх мэдээллийг ROB-ээс устгах, эцсийн утгыг бүртгэх нь дахин эрэмбэлэх буферт орсон үйлдлийн дарааллаар хийгддэг. Энэ нь онцгой тохиолдол эсвэл тасалдсан тохиолдолд дараалсан бүх дараалсан үйлдлүүдийн үр дүнг өөрчлөхөд зайлшгүй шаардлагатай.

Бүхэл тоон командуудыг гүйцэтгэх

K8 ба K10 процессоруудад бүхэл тоон үйлдлийн блок ( Бүхэл тоо гүйцэтгэх нэгж) гурван тэгш хэмтэй бүхэл сувгаас бүрдэнэ. Тооцооллын суваг бүр нь 8 MOS дараалалтай, бүхэл тоон арифметик логик нэгжүүд (ALU), хаягийн нэгжүүд (AGU) болон нөхцөлт салбар нэгж бүхий өөрийн хуваарьтай байдаг. Үүнээс гадна үржүүлэх блок нь тооцооллын суваг 0-д холбогдсон ба LZCNT болон POPCNT шинэ үйлдлүүдийг гүйцэтгэх блок (доор дэлгэрэнгүй) тооцооллын суваг 2-т холбогдсон байна.


Цагаан будаа. 3. Бүхэл тоон үйлдлийг гүйцэтгэх блок


MOP бүрийн дарааллын сонголтыг декодчилогчийн гаралт дээр үүссэн гурвалсан дахь командын статик байрлалаар тодорхойлно. Гурвалсан дахь макро үйлдэл бүрийг дахин эрэмбэлэх буферээс гүйцэтгэхээр илгээдэг бөгөөд энэ нь нэг талаас командын удирдлагыг хялбаршуулж, нөгөө талаас хамааралтай үйлдлүүдийн гинжин хэлхээ нь тааламжгүй байрлалтай байвал дарааллыг тэнцвэргүй ачаалахад хүргэдэг. програмын код (гэхдээ энэ нь практикт бараг хэзээ ч тохиолддоггүй тул гүйцэтгэлд бага нөлөө үзүүлдэг). Үржүүлгийн болон өргөтгөсөн битийн үйлдлүүд нь заасан сувагт орохыг баталгаажуулахын тулд декодчилогчоор зөв гурвалсан үүрэнд байрлуулна.

Тооцооллын сувгийн хуваарьлагчдын дараалалд MOP нь дээр дурдсанчлан санах ойд нэвтрэх бүхэл тоон бичил үйлдэл, хаягийн микро үйлдэлд хуваагддаг. Өгөгдөл бэлэн болмогц хуваарьлагч дараалал бүрээс ALU төхөөрөмж рүү нэг бүхэл тоо, AGU төхөөрөмж рүү нэг хаягийн үйлдлийг эхлүүлэх боломжтой. Санах ойд нэгэн зэрэг нэвтрэх тоо хоёроор хязгаарлагддаг. Тиймээс цагийн мөчлөг бүрт 3 бүхэл тоо, санах ойн 2 үйлдэл (ямар ч хослолоор 64 бит унших/бичих) гүйцэтгэх боломжтой. Төрөл бүрийн арифметик MOP-ийн бичил үйлдлийг дарааллаар нь өгөгдөл бэлэн болмогц дарааллаар нь гүйцэтгэхээр илгээдэг. MOP-ийн арифметик болон хаягийн бичил үйлдлүүд дууссаны дараа MOP-г хуваарийн дарааллаас хасч, дараагийн үйлдлүүдэд орон зайг чөлөөлнө.

K8 процессорын хувьд санах ойн бичил үйлдлийн системүүд нь програм хангамжийн дарааллаар сонгогддог. Програмын дарааллын дарааллаар хийгдсэн санах ойд хандах үйлдлүүд өмнөхөөсөө өмнө ажиллах боломжгүй. Энэ нь дараагийн үйлдлүүдийн бүх операндууд бэлэн байсан ч гэсэн өмнөх хаягийн үйлдлийн хаягийг тооцоолж чадаагүйгээс дараагийн бүх хаягийн үйлдлийг блоклодог.

Жишээлбэл:

ebx, ecx нэмнэ
mov eax, – хаягийн хурдан тооцоолол
mov ecx, – хаяг нь өмнөх командын үр дүнгээс хамаарна
mov edx - өмнөх бүх командын хаягийг тооцоолох хүртэл энэ тушаалыг ажиллуулахгүй.


Энэ нь гүйцэтгэлийн торгуульд хүргэж болзошгүй бөгөөд K8 процессорыг хязгаарлах хүчин зүйлүүдийн нэг бөгөөд үүний улмаас зарим кодууд дээр K8 нь цагийн мөчлөг бүрт хоёр унших зааврыг гаргах чадвартай ч санах ойд нэвтрэх зааврыг нэгээс бага үр ашигтай гүйцэтгэдэг. Цөм 2 процессор нь нэг цагийн мөчлөгт нэг унших командыг ажиллуулдаг боловч өмнөх унших, бичих командуудыг алгасаж унших командуудыг дарааллаар нь гүйцэтгэх механизмтай.

K10 архитектурын процессоруудад энэ саад бэрхшээлийг арилгасан. K10 процессорууд унших болон унших хаягууд хоорондоо зөрчилддөггүй гэдгийг процессор мэдэж байгаа тохиолдолд унших командуудыг дараалалгүй ажиллуулахаас гадна унших командын өмнө бичих командуудыг ажиллуулах боломжтой болсон. Уншихыг алгасаж бичиж эхлэх нь тодорхой төрлийн кодын гүйцэтгэлийг ихээхэн хурдасгах боломжийг олгодог, жишээлбэл, санах ойноос өгөгдлийн дараагийн хэсгийг унших тушаалаар эхэлж, тооцоолсон үр дүнг санах ойд хадгалах замаар дуусдаг циклүүд.
.....// өгөгдөл дээрх үйлдлүүд
mov , eax // үр дүнг хадгалах
cmp
jnz L1
Ийм тохиолдолд бичихээс өмнө уншиж эхлэхийг дэмждэггүй процессор ажиллаж эхлэх боломжгүй дараагийн давталтодоогийн үр дүнг бичих хүртэл давталт. Уншсан дахин эрэмбэлэхийг дэмждэг процессорууд нь одоогийнхыг дуусгахыг хүлээлгүйгээр дараагийн давталтанд өгөгдөл ачаалж, тооцоолох боломжтой.

Харамсалтай нь, K10 процессор нь Core 2 процессоруудын адил үл мэдэгдэх хаяг руу бичих замаар хэрхэн таамаглаж ачаалахаа мэдэхгүй байна.Ийм таамаглал нь торгууль төлөхөд хүргэдэг ч бодит байдал дээр эдгээр торгууль нь програмын кодонд ховор тохиолддог (ойролцоогоор 5). % тохиолдлууд), тиймээс таамаглалын ачаалал нь гүйцэтгэлийн үүднээс зөвтгөгддөг.

K10 процессорын бүхэл тоон блокийн өөр нэг сайжруулалт нь бүхэл тоо хуваах зааврын алгоритмыг оновчтой болгосон явдал юм. Одоо бүхэл тоо хуваах зааврын гүйцэтгэлийн хурд нь ногдол ашиг ба хуваагчийн хамгийн чухал битүүдээс хамаарна. Жишээлбэл, ногдол ашиг нь тэгтэй тэнцүү тохиолдолд хуваах нь бараг хоёр дахин хурдан хийгддэг. Ерөнхийдөө бүхэл тоо хуваах нь маш ховор үйлдэл бөгөөд гүйцэтгэлийн хурд бага тул бодит программ дээр бүх талаар зайлсхийх, хуваагчийн урвуугаар үржүүлэх, шилжүүлэх, өөр аргаар тойрч гарахыг хичээдэг. Тиймээс энэ оновчлол нь програмын гүйцэтгэлд мэдэгдэхүйц хувь нэмэр оруулахгүй байх магадлалтай.

Ерөнхийдөө K10 бүхэл төхөөрөмжийн блок нь маш үр дүнтэй байх болно. Санах ойн үйлдлүүдийг эмх цэгцгүй гүйцэтгэх механизмыг нэмсний дараа энэ нь тодорхой сул талгүй болсон. Хэдийгээр Core 2 процессортой харьцуулахад дарааллын гүн бага боловч K10 процессоруудад регистр файлаас регистрийг уншихад хязгаарлалт байхгүй бөгөөд Core 2-ыг аль болох хурдан үйлдлийг байнга гүйцэтгэхэд саад болдог бусад хуваарийн хязгаарлалтууд байдаггүй.

Бодит зааврыг биелүүлэх

K8 болон K10 процессоруудад хөвөгч цэгийн нэгж (FPU) хуваарь нь бүхэл тооны зааварчилгааны хуваарьчаас тусдаа бөгөөд арай өөрөөр зохион байгуулагдсан. Хуваарилагч буфер нь 3 MOP-ийн 12 бүлгийг (онолын хувьд 36 бодит үйл ажиллагаа) багтааж болно. Тэгш хэмт тооцооллын суваг бүхий бүхэл тоон зааврыг гүйцэтгэх блокоос ялгаатай нь хөвөгч арифметик блок нь гурван зүйлийг агуулна. янз бүрийн төхөөрөмж: Бодит нэмэхэд зориулсан FADD, бодит үржүүлэхэд зориулсан FMUL, санах ой хадгалах заавар болон туслах хөрвүүлэх үйлдлүүдэд зориулагдсан FMISC (FSTORE гэх мэт) тул хуваарийн буфер нь зааврын бүлэг дэх MOP-ийн байрлалыг тодорхой тооцоолох төхөөрөмжтэй холбодоггүй (Зураг 1). 4).



Цагаан будаа. 4. Хөвөгч цэгийн гүйцэтгэлийн нэгж


K8 ба K10 цагийн мөчлөг бүр бодит арифметик төхөөрөмж бүрт нэг үйлдлийг гүйцэтгэх боломжтой. K8 процессорын хөвөгч цэгийн төхөөрөмжүүд нь 80 бит юм. 128 битийн SSE вектор заавар нь код тайлах шатанд хоёр MOP-д хуваагддаг бөгөөд тэдгээр нь 128 битийн операндын 64 битийн тал дээр үйлдлүүдийг гүйцэтгэдэг бөгөөд өөр өөр цагийн мөчлөгөөр дараалан гүйцэтгэгддэг. Энэ нь зөвхөн вектор командын гүйцэтгэлийн хурдыг хязгаарлаад зогсохгүй FPU хуваарийн буферийн үр дүнтэй эзэлхүүнийг бараг хоёр дахин бууруулж, улмаар захиалгат тушаалын гүйцэтгэлийн гүнийг бууруулдаг.

K10 процессорын хувьд FPU төхөөрөмжүүдийн өргөн 128 бит хүртэл нэмэгдсэн. K10 нь 128 битийн вектор операндуудыг бүхэлд нь нэг үйлдлээр боловсруулдаг бөгөөд энэ нь K8-тай харьцуулахад вектор SSE зааврын онолын гүйцэтгэлийн хурдыг хоёр дахин нэмэгдүүлдэг. Нэмж дурдахад, MOP-ийн тоог хоёр дахин бууруулснаар хуваарь гаргагчийн үр дүнтэй дарааллын урт нэмэгдэж, дараалалгүй гүйцэтгэлийг гүнзгийрүүлэх боломжийг олгодог.

K8 процессор дээр SSE ачаалах командуудыг FSTORE төхөөрөмж ашиглан гүйцэтгэдэг бөгөөд энэ нь нэг талаас энэ төхөөрөмжийг шаарддаг бусад тушаалуудыг нэгэн зэрэг гүйцэтгэхийг зөвшөөрдөггүй, нөгөө талаас нэгэн зэрэг эхлүүлсэн ачаалах командын тоог хязгаарладаг. нэг. Хэрэв командуудын аль нэг нь санах ойд хандах хандалт болон өгөгдлийн үйлдлийг (Ачаалах-Гүйцэтгэх команд гэгддэг) хослуулсан заавар байвал K8-ийн санах ойноос хоёр зэрэгцээ уншилтыг хийж болно, жишээлбэл, ADDPS xмм1,.

K10 процессор нь SSE ачаалах командыг гүйцэтгэх механизмд хэд хэдэн чухал сайжруулалт хийсэн.

Нэгдүгээрт, ачаалах командууд нь FPU нөөцийг ашиглахаа больсон тул FSTORE порт бусад командуудыг ажиллуулахын тулд суллагдсан бөгөөд ачаалах командуудыг цагийн мөчлөг бүрт 2 удаа ажиллуулж болно.

Хоёрдугаарт, санах ойн өгөгдөл нь 16 байт хязгаарт зэрэгцсэн тохиолдолд MOVU** өгөгдөл ачаалах зааврууд зэрэгцээгүй MOVA** өгөгдөл ачаалах заавартай адил үр дүнтэй ажилладаг. Тиймээс K10 процессоруудын хувьд MOVA** зааврыг ашиглах нь ямар ч ашиг тусаа өгөхөө больсон.

Гуравдугаарт, K10 процессоруудад ачааллыг өгөгдлийн үйлдэлтэй хослуулсан Ачаалах-Гүйцэтгэх командуудад тэгш бус ачааллыг ашиглахыг зөвшөөрдөг болсон. Ихэвчлэн санах ойд өгөгдөл зэрэгцсэн эсэх нь эргэлзээтэй байвал хөрвүүлэгч (эсвэл программист) MOVU** зааврыг ашиглан өгөгдлийг регистр рүү уншиж, дараа нь регистрүүд дээр үйлдлүүдийг гүйцэтгэдэг. Ачаалах-Гүйцэтгэх командуудыг ашиглан тэгшлээгүй ачааллыг шууд ашиглах нь таны програмын код дахь тусдаа ачаалах командын тоог мэдэгдэхүйц бууруулж, гүйцэтгэлийг сайжруулна. Энэ функцийн дэмжлэгийг хөрвүүлэгчид суулгасан байх ёстой. Ерөнхийдөө SSE тодорхойлолтын дагуу боловсруулсан Intel компани, Load-Execute командыг 16 байт хил дээр зэрэгцүүлээгүй хаяг руу залгахад онцгой тохиолдол гарах ёстой. Техникийн үзүүлэлтийг дагаж мөрдөхийн тулд Ачаалах-Гүйцэтгэх командуудад жигд бус ачааллыг зөвшөөрөхийг шинэ процессорын чадавхийг харгалзан боловсруулж, эмхэтгэсэн программ хангамжаар тусгай тугийг тохируулах замаар идэвхжүүлэх шаардлагатай.

Дөрөвдүгээрт, K10 процессорын эхний түвшний кэшээс өгөгдөл унших хоёр автобусыг 128 бит болгон өргөжүүлсэн. Энэ нь процессорыг цаг тутамд 128 битийн өгөгдлийг хоёр удаа унших боломжийг олгодог. Энэ нь архитектурын маш чухал шинж чанар юм, учир нь хоёр командыг зэрэгцүүлэн гүйцэтгэхэд 4 операнд (нэг заавар бүрт 2) шаардлагатай байдаг ба хэд хэдэн урсгалтай өгөгдөл боловсруулах алгоритмд дөрвөн операндын хоёрыг нь ихэвчлэн RAM-аас уншдаг. Үүний эсрэгээр, K10-ийн хоёр бичих автобус нь 64 битийн хэмжээтэй хэвээр байгаа бөгөөд 128 битийн санах ойн бичилт нь 64 битийн хоёр багцад хуваагддаг. Тиймээс процессор нь цагийн мөчлөг бүрт зөвхөн нэг 128 бит бичих, эсвэл хоёр 128 бит унших, эсвэл нэг 128 бит унших, нэг 64 бит бичих тэсрэлт хийх боломжтой. Гэсэн хэдий ч уншсан тоо нь бичих тооноос дор хаяж хоёр дахин их байдаг тул бичих хязгаар нь 128 битийн өгөгдлийг боловсруулах үед процессорын үр ашигт ихээхэн нөлөөлөх ёсгүй.

Тавдугаарт, 128 битийн MOV*** бүртгэлээс өгөгдөл хуулбарлах зааврыг зөвхөн FADD болон FMUL бус гурван FPU төхөөрөмж дээр гүйцэтгэх боломжтой бөгөөд энэ нь зорилтот үйл ажиллагаанд FADD болон FMUL блокуудыг чөлөөлдөг.

Бидний харж байгаагаар K10 процессорын FPU нэгж нь илүү уян хатан болсон. Ачаалах-Гүйцэтгэх командуудыг багтаасан үр ашигтай, жигдрээгүй ачаалах, цаг тутамд хоёр 128 бит унших зэрэг Intel процессоруудад хараахан байхгүй өвөрмөц онцлогууд байдаг. Core 2-оос ялгаатай нь бодит болон бүхэл тоо төлөвлөгчид тусдаа дарааллыг ашигладаг бөгөөд энэ нь ижил гүйцэтгэлийн портууд дээр зөрчилдөх үйлдлээс зайлсхийхэд тусалдаг. Гэсэн хэдий ч K10 нь SSE дэлгүүрийн үйл ажиллагаанд зориулсан FMISC (FSTORE) төхөөрөмжийг зарим өгөгдөл хувиргах командуудтай хуваалцсан хэвээр байгаа бөгөөд энэ нь зарим тохиолдолд гүйцэтгэлийн хурдад нөлөөлж болзошгүй юм.

Ерөнхийдөө K10 дахь FPU нэгж нь хэд хэдэн параметрийн хувьд Core 2 FPU нэгжийг давж (жишээ нь, нэг цагийн мөчлөгт хоёр 128 бит уншилт хийх, үр ашигтай жигд ачаалал өгөх чадвар) маш үр ашигтай байх болно гэж амлаж байна.

Санах ойн дэд систем

Төхөөрөмжийг ачаалах/хадгалах

K8 процессор дээр AGU дээрх санах ойн хандалтын хаягийг тооцоолсны дараа ачаалах, хадгалах ажиллагааг LSU (Ачаалах / Хадгалах Нэгж) - ачаалах / хадгалах төхөөрөмж рүү илгээдэг. LSU нь LS1 ба LS2 гэсэн хоёр дарааллыг агуулдаг. Нэгдүгээрт, ачаалах, хадгалах үйлдлүүд нь LS1 дараалалд ордог бөгөөд энэ нь 12 элементийн гүн юм. LS1 дарааллаас эхний түвшний кэш рүү хандах хандалтыг програм хангамжийн дарааллаар хийдэг бөгөөд нэг мөчлөгт хоёр үйлдэл хийдэг. Кэш алдагдсан тохиолдолд үйлдлүүдийг 32 элементийн гүн LS2 хоёр дахь дараалал руу шилжүүлж, L2 кэш болон RAM-д хандалт хийдэг.

LSU дээр K10 процессорт өөрчлөлт оруулсан. Одоо зөвхөн ачаалах үйлдлүүд LS1 дараалалд очих ба хадгалах үйлдлүүд LS2 дараалал руу илгээгдэнэ. LS1-ээс ачаалах үйлдлийг одоо LS2 дараалалд хадгалах үйлдлүүдийн хаягийг харгалзан дарааллаар нь гүйцэтгэх боломжтой. Дээр дурдсанчлан 128 битийн хадгалах үйлдлүүд нь K10 процессор дээр хоёр 64 бит байдлаар боловсруулагддаг тул LS2 дараалалд хоёр байрлалыг эзэлдэг.

1-р түвшний кэш

K8 болон K10 процессоруудын эхний түвшний кэш нь тусдаа бөгөөд заавар (L1I) болон өгөгдөлд (L1D) тус бүр 64 КБ хэмжээтэй байна. Кэшийн холбоо нь хоёр, мөрийн хэмжээ 64 байт. Холбоо барих чадвар бага нь ижил багцын төлөө өрсөлдөж буй мөрүүдийн хооронд байнга мөргөлдөхөд хүргэдэг бөгөөд энэ нь кэш алдах тоог нэмэгдүүлж, гүйцэтгэлд сөргөөр нөлөөлдөг. Бага нэгдэл нь нэлээд том L1 кэшээр хэсэгчлэн нөхөгддөг. L1D кэшийн том давуу тал нь түүний хос портын чадвар юм - энэ нь цаг тутамд хоёр унших, бичих командыг дурын хослолоор гүйцэтгэх боломжтой.

K10 процессорын хувьд эхний түвшний кэшийн хэмжээ, холбоо нь харамсалтай нь өөрчлөгдөөгүй хэвээр байна. K10-ийн L1 кэшийн цорын ганц мэдэгдэхүйц сайжруулалт нь унших өгөгдлийн автобусны өргөнийг нэмэгдүүлэх явдал байв. Одоо процессор нь өмнөх бүлэгт дурдсанчлан цагийн мөчлөг бүрт 128 битийн хоёр уншилт хийх боломжтой бөгөөд энэ нь SSE өгөгдлийг дотоод санах ойд боловсруулахад түүний үр ашгийг ихээхэн нэмэгдүүлдэг.

2-р түвшний кэш

K8 ба K10 архитектурын хоёр ба дөрвөн цөмт процессоруудад цөм бүр L2 кэштэй байдаг. K10-ийн хоёр дахь түвшний кэшийн хэмжээ нь цөм тус бүр дээр 512 КБ-тай тэнцүү хэвээр байгаа бөгөөд нэгдэл нь 16 байна. Хоёр дахь түвшний кэш нь Core 2 процессорын хоёр дахь түвшний хуваалцсан кэштэй харьцуулахад давуу болон сул талуудтай. Давуу тал нь: хэд хэдэн цөмийн нэгэн зэрэг эрчимтэй ачааллын дор кэш тутамд зөрчилдөөн, өрсөлдөөн байхгүй байх. Сул тал нь нэг ажлыг эрчимтэй гүйцэтгэх үед цөмд ногдох кэшийн хэмжээ бага байдаг.

L2 кэш нь өгөгдөл хадгалах онцгой зохион байгуулалттай: эхний болон хоёрдугаар түвшний кэш дэх өгөгдөл давхарддаггүй. Эхний болон хоёрдугаар түвшний кэш нь нэг чиглэлтэй хоёр автобусаар өгөгдөл солилцдог - нэг нь өгөгдөл хүлээн авах, нөгөө нь илгээх зориулалттай. K8 архитектурын процессорт автобус бүрийн өргөн нь 64 бит (8 байт) байна (Зураг 5а.). Энэ зохион байгуулалттай учраас процессор нь L2-д хүссэн өгөгдлийг цаг тутамд 8 байт бага хурдтайгаар хүлээн авдаг. Өөрөөр хэлбэл, 64 байт мөрийг шилжүүлэхэд 8 цагийн цикл шаардлагатай бөгөөд энэ нь үндсэн өгөгдөл хүлээн авах, ялангуяа хоёр ба түүнээс дээш L2 кэш шугамд нэгэн зэрэг нэвтрэх үед ихээхэн хэмжээний саатлыг нэмэгдүүлдэг.

Бүрэн батлагдаагүй байгаа мэдээллээс үзэхэд K10 процессорын хүлээн авах болон дамжуулах автобусны битийн өргөн 2 дахин, өөрөөр хэлбэл тус бүр нь 128 бит хүртэл нэмэгдсэн байна (Зураг 5б). Энэ нь нэгэн зэрэг хоёр ба түүнээс дээш мөр хүсэх үед кэш хандалтын хоцролтыг мэдэгдэхүйц бууруулах болно.



3-р түвшний кэш

Хоёрдахь түвшний кэшийн хангалтгүй хэмжээг нөхөхийн тулд K10 процессор нь одоо бүх цөмд нийтлэг 2 МБ гурав дахь түвшний L3 кэштэй болсон бөгөөд 32-ын нэгдэлтэй байна. L3 кэш нь дасан зохицох онцгой зохион байгуулалттай: энэ нь хоёр өгөгдлийг хоёуланг нь хадгалдаг. бүх цөмүүдийн L2 кэшээс хасагдсан бөгөөд олон цөмд ашигладаг өгөгдлийг хуваалцсан. Цөмөөс мөрийг унших хүсэлтийг хүлээн авах үед шалгалт хийгдэнэ: хэрэв мөрийг зөвхөн нэг цөм ашиглаж байгаа бол L3-аас хасагдаж, шугамын L2 кэшээс гаргах зайг чөлөөлнө. гол хүсэлт. Хэрэв мөрийг өөр цөм ашиглаж байгаа бол энэ нь кэшэд үлдэх болно; Үүний зэрэгцээ, L2 кэшээс зайлуулж буй шугаманд зай гаргахын тулд өөр хуучин мөрийг L3 кэшээс устгана.

L3 кэш нь цөм хоорондын харилцааны хурдыг нэмэгдүүлэхэд туслах ёстой. Бидний өмнө олж мэдсэнээр орчин үеийн Athlon 64 процессоруудын цөмүүдийн хооронд өгөгдөл солилцох нь санах ойн автобусаар явагддаг. Энэ нь хуваалцсан, өөрчлөх боломжтой өгөгдөлд хандах хурдыг эрс бууруулдаг. AMD-ийн материалуудын дагуу K10 архитектурын дөрвөлсөн цөмт процессоруудад L3 кэшээр дамжуулан цөм хоорондын мэдээлэл солилцох боломжтой. Өөр цөмөөс хүсэлт хүлээн авах үед өөрчилсөн өгөгдлийг хадгалдаг цөм нь үүнийг L3 руу хуулж, тэндээс хүсэлт гаргасан цөм үүнийг унших болно. Өөр цөмийн кэш дэх өөрчлөгдсөн өгөгдөлд хандах хурд мэдэгдэхүйц нэмэгдэх ёстой. Боломж олдвол заавал шалгах болно :).


Цагаан будаа. 6. K10 процессорын цөм хоорондын өгөгдөл дамжуулах


L3 кэшийн хоцролт нь L2 кэшийн хоцрогдолтой харьцуулахад өндөр байх нь ойлгомжтой, гэхдээ AMD-ийн материалууд ачаалалаас хамааран дасан зохицох байдлаар өөрчлөгдөнө гэж хэлдэг - хүнд ачаалал байхгүй тохиолдолд хоцролт нь илүү сайн, ачаалал ихтэй байх болно. хувь хэмжээ нэмэгдэх болно. Үүний цаана яг юу байгааг шалгах л үлдлээ.

TLB

Заавар, өгөгдөлд зориулсан кэш санах ойноос гадна процессорууд өөр төрлийн кэш санах ойтой байдаг - орчуулга-харагдах буфер (TLB). Эдгээр нь хуудасны орчуулгын хүснэгтээс олж авсан виртуал болон физик хуудасны хаягуудын хоорондын захидал харилцааг хадгалахад ашиглагддаг. Орчуулгын буферийн тоо нь нэмэлт үнэтэй хүснэгт хөрвүүлэлтгүйгээр хэдэн санах ойн хуудсыг нэгэн зэрэг ашиглахыг тодорхойлдог. Энэ нь санах ойн өгөгдлийг санамсаргүй дарааллаар боловсруулдаг програмуудад онцгой чухал бөгөөд өгөгдөлд байнгын хандалт байдаг өөр өөр хуудаснууд. K10 процессор нь орчуулгын буферийн тоог ихээхэн нэмэгдүүлсэн. Ойлголтыг хөнгөвчлөхийн тулд тэдгээрийг хүснэгтэд нэгтгэн харуулав.

Хүснэгт 1 – K8 болон K10 процессоруудын TLB хүчин чадал


Хүснэгтээс харахад 2 МБ хуудасны хаягийг хөрвүүлэхэд ашигладаг буферийн тоо мэдэгдэхүйц нэмэгдэж, 1 ГБ хэмжээтэй том хуудасны дэмжлэг гарч ирсэн нь их хэмжээний өгөгдөл боловсруулдаг серверүүдэд ашигтай байх болно. Үйлдлийн системийн дэмжлэгтэйгээр 2-MB болон 1-ГБ хэмжээтэй том хуудас ашигладаг програмууд гүйцэтгэлийн өсөлтөөс ашиг хүртэх болно.

Санах ойн хянагч

Хүссэн өгөгдөл нь бүх түвшний кэшээс олдоогүй тохиолдолд процессорын чип дээр суурилуулсан санах ойн хянагч руу залгана. Процессорын чип дээр хянагчийг нэгтгэх нь санах ойд хандах үеийн хоцролтыг эрс багасгаж, процессорыг тодорхой төрлийн санах ойд холбож, үндсэн талбайг нэмэгдүүлж, чипээс татгалзахтай холбоотой асуудлуудыг нэмэгдүүлдэг. Санах ойн хянагч нь K8 процессоруудын давуу талуудын нэг байсан боловч зарим тохиолдолд хангалттай үр ашиггүй байв. K10 процессорын санах ойн хянагч мэдэгдэхүйц сайжирсан.

Нэгдүгээрт, энэ нь одоо зөвхөн нэг 128 битийн суваг төдийгүй хоёр бие даасан 64 битийн суваг дээр өгөгдөл дамжуулах горимд ажиллах боломжтой бөгөөд энэ нь олон цөмөөр нэгэн зэрэг санах ойд нэвтрэх боломжийг илүү үр дүнтэй болгодог.

Хоёрдугаарт, хянагч дээр үйл ажиллагааны хуваарь гаргах, дахин эрэмбэлэх алгоритмыг оновчтой болгосон. Санах ойн хянагчийн бүлгүүд санах ойн автобусыг хамгийн үр дүнтэй ашиглахын тулд унших, бичих үйлдлүүдийг гүйцэтгэдэг. Унших үйлдлүүд нь бичих үйлдлээс илүү байдаг. Бичихэд зориулагдсан өгөгдлийг буферт хадгалдаг бөгөөд хэмжээ нь одоогоор тодорхойгүй байгаа боловч янз бүрийн эх сурвалжийн мэдээлснээр 16-30 64 байт мөрийн хооронд байдаг. Хэд хэдэн хойшлогдсон шугамын бүлгийг буулгах нь санах ойн автобусыг унших горимоос бичих горимд шилжүүлэх, буцаах зардлыг мэдэгдэхүйц бууруулж чадна. Энэ нь ялангуяа унших, бичих хүсэлтийн урсгалтай ажиллах үед гүйцэтгэлийг сайжруулдаг.

Гуравдугаарт, санах ойн хянагч нь хүсэлтийн дарааллыг шинжилж, урьдчилан татаж авах боломжтой.

Урьдчилан татах

Урьдчилан татах нь K8 процессоруудын хүчтэй тал биш юм. Нэгдсэн бага хоцролттой санах ойн хянагч урт хугацаанд AMD процессоруудад санах ойтой ажиллахдаа сайн гүйцэтгэлийг харуулах боломжийг олгосон. Гэсэн хэдий ч шинэ DDR2 санах ойтой ажиллахдаа K8 процессорууд нь хүчирхэг урьдчилан татах системтэй Core 2 процессоруудаас ялгаатай нь өндөр үр ашигтай байсангүй. K8 процессорууд нь хоёр урьдчилан татах төхөөрөмжтэй байдаг - нэг нь код, нөгөө нь өгөгдөл юм. Мэдээллийг урьдчилан татах төхөөрөмж нь хялбаршуулсан дарааллыг ашиглан хоёрдугаар түвшний кэш рүү урьдчилан татаж авах ажиллагааг гүйцэтгэдэг.

K10-д урьдчилан таталт сайжирсан.

Нэгдүгээрт, K10 нь L1 кэш рүү шууд урьдчилан татдаг бөгөөд энэ нь өгөгдөлд хандах үед L2 кэшийн хоцролтыг нуух боломжийг олгодог. Хэдийгээр энэ нь L1 кэш нь шаардлагагүй мэдээллээр бөглөрөх магадлалыг нэмэгдүүлдэг, ялангуяа кэш багатай холбоотой боловч AMD-ийн үзэж байгаагаар энэ нь үр дүнгээ өгч, гүйцэтгэлийг сайжруулдаг.

Хоёрдугаарт, дасан зохицох урьдчилан татах механизмыг хэрэгжүүлсэн бөгөөд энэ нь өгөгдөл цаг тухайд нь ирж, кэшийг хараахан шаардлагагүй өгөгдлөөр бөглөхгүй байхын тулд урьдчилан татах зайг динамикаар өөрчилдөг. Урьдчилан ачаалах нэгжийн уян хатан байдал нэмэгдсэн: энэ нь одоо зөвхөн зэргэлдээх мөрөнд байрлах хаягууд дээр биш, дурын хаяг дахь санах ойн хүсэлтээс суралцах боломжтой болсон. Нэмж хэлэхэд, prefetch блок нь одоо програм хангамжийн урьдчилан татах зааврыг хүндэтгэдэг.

Гуравдугаарт, санах ойн хянагч дээр тусдаа урьдчилан ачаалах нэгжийг шууд нэмсэн. Санах ойн хянагч нь цөмөөс ирсэн хүсэлтүүдийн дарааллыг шинжилж, өгөгдлийг бичих буфер руу ачаалж, санах ойн автобусыг оновчтой ашигладаг. Урьдчилан дуудах мөрүүдийг бичих буферт хадгалах нь кэш санах ойг бөглөрөхөөс зайлсхийхийн зэрэгцээ өгөгдөлд нэвтрэх хоцролтыг эрс багасгах боломжийг олгоно.

Үүний үр дүнд K10 процессоруудын санах ойн дэд системд өөрчлөлт орсон болохыг бид харж байна илүү сайн тал. Гэхдээ хэд хэдэн шинж чанараараа энэ нь Intel процессоруудын санах ойн дэд системээс доогуур байж болохыг тэмдэглэх нь зүйтэй. Энэ нь хараахан тодорхойгүй хаяг руу бичихийг тойрч гарах таамаглалын ачаалал байхгүй, L1D кэшийн холбоо бага, L1 ба L2 кэшийн хооронд нарийссан (өгөгдлийн дамжуулалтын хурдны хувьд) автобус, L2 хэмжээ бага, урьдчилан татаж авах нь илүү хялбар байдаг. Сайжруулсан хэдий ч Core 2-ийн урьдчилан татах чадвар нь K10-аас илүү хүчтэй байж болох юм: жишээлбэл, сүүлийнх нь зааврын үйлдлийг хянах заавар-хаяг урьдчилан татах, түүнчлэн L2-ийн хоцролтыг үр дүнтэй далдлахын тулд L2-оос L1 хүртэл урьдчилан татах боломжгүй. Эдгээр хүчин зүйлүүд нь өөр өөр програмуудад өөр өөрөөр нөлөөлж болох ч зарим тохиолдолд Intel процессоруудын гүйцэтгэлийг сайжруулахад хүргэдэг.

K10 архитектур бидэнд өөр ямар шинэлэг зүйлийг авчирдаг талаар товчхон харцгаая.

Шинэ багууд

K10 процессор нь одоо түүний чадавхийг өргөжүүлэх хэд хэдэн шинэ командыг дэмждэг.

1. Ерөнхий зориулалтын регистр дээр өргөтгөсөн битийн үйлдлүүдийн командууд:

LZCNT – Count Leading Zeros – операнд дахь эхний тэг битийн тоог тоолно;
POPCNT – Битийн популяцийн тоо – операнд дахь нэг битийн тоог тоолно.

2. SSE4a гэж нэрлэгддэг SSE бүртгэл боловсруулах заавар:

EXTRQ – SSE регистрийн доод 64 битийн хэсэгт заасан байрлалаас тодорхой тооны битүүдийг гаргаж авдаг;
INSERTQ – SSE регистрийн доод 64 битийн хэсэгт заасан байрлалд заасан тооны битүүдийг оруулна;
MOVNTSS, MOVNTSD – скаляр бодит утгыг хадгалах (кэш санах ой ашиглахгүйгээр) дамжуулах командууд.

SSE4a гэж нэрлэгддэг зааврын багц өргөтгөл нь бие даасан бөгөөд SSE4.1 болон SSE4.2 гэж нэрлэгддэг Intel-ийн шинэ өргөтгөлүүдтэй ямар ч байдлаар давхцдаггүй.

Виртуалчлал

AMD нь хэд хэдэн удаа ажиллуулахад ашигладаг виртуалчлалын технологийг үргэлжлүүлэн сайжруулсаар байна үйлдлийн системүүднэг компьютер дээр. Виртуалчлалын хамгийн чухал сайжруулалтын нэг нь үүрлэсэн хуудасны хүснэгтүүдийг (Nested Paging) ашиглах явдал байв. Энэ горимд виртуал машины хуудасны хүснэгтүүд нь дэлхийн гипервизорын хуудасны хүснэгт дотор байрладаг. TLB-д хуудасны лавлагаа байхгүй тохиолдолд Shadow Paging-ээс ялгаатай нь хүснэгтийг хөрвүүлэх үйлдлийг процессор автоматаар гүйцэтгэдэг. их хэмжээнийвиртуал машины хүснэгтийн зураглалыг удирдах нөөц.


Зарим мэдээллээр, үүрлэсэн хуудасны хүснэгтүүдийг ашигласны ачаар програмын хурд хүртэл байна виртуал машин"сүүдэр" хуудасны хүснэгтүүдийг ашиглах үед эдгээр програмуудын гүйцэтгэлийн хурдтай харьцуулахад 40% хүртэл нэмэгддэг.

Эрчим хүч ба давтамжийн удирдлага

Шинэ K10 процессорууд нь эрчим хүчний менежмент болон үндсэн давтамжийн удирдлагын шинэ схемийг нэвтрүүлж байна. Цөм тус бүр өөрийн давтамжтайгаар бусдаас үл хамааран ажиллах боломжтой бөгөөд энэ нь цөм бүрийн ачааллаас хамааран динамикаар өөрчлөгддөг.


Цагаан будаа. 8. Бие даасан давтамжийн хяналт
K10 процессор дахь цөм


Үүний зэрэгцээ бүх цөмд нийтлэг байдаг L3 кэшийн ажиллах давтамжийг хэрхэн зохицуулах нь тодорхойгүй хэвээр байна. Бүх судал дээрх хүчдэл нь ижил бөгөөд хамгийн их ачаалалтай цөмөөр тодорхойлогддог. Санах ойн хянагч нь хүчдэлээ цөмөөс хамааралгүйгээр хянадаг бөгөөд хүнд ачаалал байхгүй үед үүнийг бууруулж чаддаг.

дүгнэлт

Шинэ AMD процессоруудын талаарх бүх мэдээлэл хараахан хэвлэгдээгүй байгаа тул гэнэтийн зүйл биднийг хүлээж магадгүй юм. Гэсэн хэдий ч бичил архитектурын үндсэн дүгнэлтийг аль хэдийн гаргаж болно. Шинэ AMD процессор нь олон тооны үндсэн сайжруулалтуудын ачаар өмнөх хувилбараасаа, ялангуяа бодит цагийн эрчимтэй хэрэглээнд гүйцэтгэлийн хувьд мэдэгдэхүйц үсрэлт амлаж байна. Өргөн хүрээний хэрэглээний хувьд процессор нь нэг давтамжтай ижил нөхцөлөөр өрсөлдөх боломжтой болно Intel процессоруудмөн тэднийг ял. Шинэ зүйлийг харгалзан бичсэн өргөдөл өвөрмөц боломжуудүр ашигтай жигд ачаалах, 1ГБ хэмжээтэй том хуудсыг дэмжих зэрэг процессор. Гэсэн хэдий ч процессор нь Intel процессортой харьцуулахад сул талуудтай байдаг - эдгээр нь кэш хийх, урьдчилан татах дэд системүүд бөгөөд энэ нь хэд хэдэн програмын гүйцэтгэлд сөргөөр нөлөөлдөг. Гэхдээ эхний шатанд дээд амжилтын төлөөх тэмцлийн хамгийн том дутагдал нь хангалтгүй байх магадлалтай өндөр давтамжтай. AMD-д шинэ давтамжуудыг хурдан хөгжүүлэхийг хүсэн ерөөж, хэрэглэгчдийн төлөөх тэмцэлд хоёр компани хэрхэн тэмцэж, процессоруудаа улам сайжруулж байгааг үргэлжлүүлэн харцгаая.

Зохиогч нийтлэлийг бэлтгэхэд тусалсан Мария Малич, Сергей Романов ака Грей нарт талархал илэрхийлж байна..
Сонгох: Шүүмж Мэдээ
Зөвхөн хэсэгт Аливаа дижитал салбарын процессорууд RAM эх хавтан Видео картууд Хөргөх систем Хадгалах хөтчүүд Кейс Моддинг Цахилгаан хангамж Мультимедиа Дижитал гэрэл зураг, видео монитор Зөөврийн компьютер, таблет Ухаалаг утас Харилцаа холбоо Дагалдах хэрэгсэл Авто электроник Програм хангамжТоглоомууд
Олдсон шошгооос хайх: amd amd a amd a4 amd a6 amd a8 amd fx amd lynx amd regor apu athlon ii x2 athlon ii x4 бульдозер комал ddr3-1600 llano phenom phenom ii x2 phenom ii x4 piledriver radeon radeon radeon radeon radeon hd640hddeon hd640deg hd 65 50d sempron дээр soc socket am2+ socket am3 socket am3+ socket fm1 socket fs1 thuban trinity zosma

Socket AM3-тай процессорууд 2013 оны хоёрдугаар улирал хүртэл зах зээл дээр байх болно

AMD-ийн төсвийн APU загваруудын үнийн бууралт

AMD нь тааламжтай гэнэтийн бэлэг байлаа хямд үнэ AMD A (Trinity) шугамын хоёр дахь үеийн APU-д зориулагдсан. Мөн ойрын ирээдүйд үнийн бодлогоо дахин баярлуулж, төсвийн АПУ-ын зардлыг мэдэгдэхүйц бууруулахаар төлөвлөж байна.

Хэрэв өмнөх үеийн загваруудын (AMD A4-3300 ба A4-3400) үнийг 46 ба 48 доллараас 30 ба 35 доллар болгон бууруулах нь нэлээд хүлээгдэж буй шийдвэр мэт харагдаж байвал (үлдсэн хувьцаагаа зарахын тулд), дараа нь бууруулах Шинэ AMD A4 эрлийз процессор 5300-ийн үнэ 53 доллараас 30 долларын хооронд хэлбэлзэж байгаа нь үнэхээр санаанд оромгүй, тааламжтай алхам юм.

Дээр дурдсан APU-ийн өртөг буурсан тухай мэдээлэл Тайваний эх хавтангийн үйлдвэрлэгчидтэй ойр эх сурвалжаас ирсэн тул шинэ үнийг албан ёсоор нэвтрүүлэх огноо тодорхойгүй хэвээр байгааг анхаарна уу. Ойрын ирээдүйд үнэ нь буурах AMD APU-ийн техникийн үзүүлэлтүүдийн хүснэгт дараах байдалтай байна.

"Мартагдсан" анхдагч түвшний процессорууд AMD Sempron X2 198 болон AMD Athlon II X2 221

Өнгөрсөн оны дундуур AMD өргөжсөн бүрэлдэхүүнХоёр шинэ анхан шатны түвшний процессор: AMD Sempron X2 198 AMD Lynx платформд зориулж бүтээгдсэн бөгөөд Socket FM1 холбогчийг дэмждэг. Гэсэн хэдий ч ялгаатай бусад ижил төстэй загварууд, эдгээр шинэ зүйлс хэзээ ч олноор худалдаалагдаж эсвэл OEM системийн зах зээлд гараагүй.

Мэдэгдэж байгаагаар загвар өмсөгчид AMD Sempron X2 198Гэсэн хэдий ч зөвхөн Хятадын зах зээлд, дараа нь Европын зах зээлд зориулагдсан бэлэн ширээний компьютеруудын нэг хэсэг болгон худалдаанд гарсан бөгөөд энэ оны эхний хагаст танилцуулагдсан.

шийдлүүд гэдгийг анхаарна уу AMD Sempron X2 198мөн хоёр процессорын цөмөөр тоноглогдсон бөгөөд нэрлэсэн давтамж нь 2.5 ба 2.8 ГГц, DDR3-1600 МГц стандартын хоёр сувгийн RAM хянагч, интерфэйс хянагч. PCI Express 2.0. Хоёр шинэ бүтээгдэхүүний TDP нь 65 Вт байна. Дэлгэрэнгүй харьцуулах хүснэгтпроцессорын техникийн үзүүлэлтүүд AMD Sempron X2 198Мөн:

AMD Sempron X2 198

Ширээний системүүд

Бичил архитектур

Платформ

CPU залгуур

Үйлдвэрлэлийн стандарт, nm

Физик цөмийн тоо

L1 кэшийн хэмжээ, КБ

Зааварчилгаа

L2 кэшийн хэмжээ, КБ

Нэгдсэн хянагч

Хос сувгийн DDR3 санах ой, PCI Express 2.0 интерфейс

Дэмжигдсэн санах ойн модулиуд

Дулааны багц (TDP), В

MMX, 3DNow!, SSE, SSE2, SSE3, SSE4a, Advanced Bit Manipulation, AMD64, Виртуалчлал, Сайжруулсан вирусын хамгаалалт, PowerNow!

Шинэ хос AMD A4-3450 болон AMD A4-4300M эрлийз процессор

Хоёр шинэ эрлийз процессор бэлтгэх тухай мэдээлэл гарсан - AMD A4-3450Тэгээд. Тэдний эхнийх нь ширээний шийдлүүдийн ангилалд багтдаг. Энэ нь AMD K10 бичил архитектур дээр суурилсан бөгөөд AMD Llano гэгддэг APU-ийн эхний үеийнх юм. Загварын зүрхэнд AMD A4-3450график цөм болох 2.8 GHz давтамжтай хоёр процессорын цөм байдаг AMD Radeon HD 6410 ба хос сувгийн RAM хянагч стандарт DDR3-1600. Шинэ бүтээгдэхүүний TDP нь 65 Вт бөгөөд энэ нь бөөнөөр худалдаанд гарахгүй, зөвхөн бүрэн тоноглогдсон ширээний компьютерт л гарах болно.

APU нь төсвийн гар утасны шийдлүүдийн ангилалд багтдаг бөгөөд хоёр дахь үеийн эрлийз процессоруудад (AMD Trinity) хамаардаг. Энэхүү шинэ бүтээгдэхүүн нь нэрлэсэн давтамж нь 2.5 ГГц, динамик нь 3.0 ГГц хүрэх боломжтой хоёр процессорын цөм, AMD Radeon HD 7420G график цөм, хоёр суваг DDR3 RAM хянагчаас бүрдэнэ.

Шинэ эрлийз процессоруудын техникийн үзүүлэлтүүдийн нарийвчилсан харьцуулалтын хүснэгт AMD A4-3450мөн иймэрхүү харагдаж байна:

Төсвийн хоёр цөмт AMD Sempron X2 190 процессор нь 49.87 долларын үнэтэй.

Шинэ төсөвт процессор Японд жижиглэн худалдаанд гарлаа. Энэ нь AMD Regor хоёр процессорын цөм, Socket AM3-ийн дэмжлэгийг ашиглан 45нм AMD K10 бичил архитектур дээр суурилдаг.

Загварын нэрлэсэн давтамж нь 2.5 GHz юм. Энэ нь нэгдсэн график цөмийг дэмждэггүй боловч хос сувгийн RAM стандарт DDR3-1066 MHz-д зориулсан суурилуулсан хянагчтай гэдгийг анхаарна уу. Шинэ бүтээгдэхүүний дулааны багц нь 45 Вт дотор байна.

Японы зах зээл дээрх энэхүү шийдлийн тооцоолсон үнэ 49.87 ам.доллар байна. Шинэ процессорын техникийн үзүүлэлтүүдийн хураангуй хүснэгт:

Зах зээлийн сегмент

Ширээний системүүд

Бичил архитектур

Цөмийн кодын нэр

CPU залгуур

Физик цөмийн тоо

Нэрлэсэн цагийн давтамж, МГц

L1 кэшийн хэмжээ, КБ

Зааварчилгаа

L2 кэшийн хэмжээ, КБ

Нэгдсэн хянагч

Хос сувгийн DDR3 санах ой

Дэмжигдсэн модулиуд

TDP үзүүлэлт, В

Ойролцоогоор үнэ

AMD A4-3420 APU нь хүн бүрт боломжтой болно

AMD нь өөрийн ширээний APU-ийн Box хувилбарыг зах зээлд гаргахаар бэлтгэж байна AMD A4-3420. Сануулахад, энэ оны нэгдүгээр сараас энэ шийдвэр OEM компаниуд бүрэн системийг бүтээхэд амжилттай ашигладаг.

Загвар AMD A4-3420 AMD "Lynx" платформд зориулсан 32 нм AMD K10 микро архитектурын үндсэн дээр бүтээгдсэн бөгөөд дараахь зүйлийг дэмждэг.

    2.8 GHz нэрлэсэн давтамжтай хоёр процессорын цөм;

    AMD Radeon HD 6410D график цөм, 600 МГц давтамжтай;

    1 MB L2 кэш;

    DDR3-1600 МГц модулиудыг дэмждэг хоёр сувгийн санах ойн хянагч.

Шинэ бүтээгдэхүүний дулааны багц нь 65 Вт багтаамжтай бөгөөд загвар нь 65 долларын үнээр худалдаанд гарах болно. Мэдээллийн хуудас APU AMD A4-3420

Загвар

AMD A4-3420

Зах зээлийн сегмент

Ширээний компьютер

Платформ

Бичил архитектур

Үйлдвэрлэлийн процессын стандартууд, nm

CPU залгуур

Физик цөмийн тоо

Нэрлэсэн цагийн давтамж, GHz

L1 кэшийн хэмжээ, КБ

Зааварчилгаа

L2 кэшийн хэмжээ, КБ

Нэгдсэн хянагч

Хос сувгийн DDR3 санах ой, график цөм, PCI Express 2.0 интерфейс

Брэндийн нэр

AMD Radeon HD 6410D

Цагийн давтамж, МГц

Дэмжигдсэн RAM модулиуд

Дулааны багц, В

Дэмждэг заавар, технологи

MMX, 3DNow!, SSE, SSE2, SSE3, SSE4a, AMD64, AMD-V (виртуалчлал), Сайжруулсан вирусын хамгаалалт, PowerNow!

Ойролцоогоор үнэ, доллар

Тодорхой процессор болон APU-д зориулсан AMD-н үнийн бодлогод гарсан өөрчлөлт

AMD компани зарим процессорууд болон APU-нхаа үнийг өөрчлөхөөр шийджээ. Ялангуяа санал болгож буй зардал зургаан цөмт процессор AMD FX-6100доллараар буурч, 155 ам.долларт хүрсэн байна. Гурван цөмт APU-ийн үнийг мөн 89 доллараас 85 доллар болгон бууруулсан.

Зарим АПУ-ын үнэ нэмэгдсэнийг анхаарна уу. Энэ нь ширээний хоёр шийдэлд хамаарна - AMD A4-3300 ба A4-3400. Тэдний үнэ 2 доллараар нэмэгдэж, 66 болон 71 долларт хүрсэн байна. Дээр дурдсан процессор болон APU-ийн техникийн үзүүлэлтүүдийн хураангуй хүснэгт дараах байдалтай байна.

Шинэ AMD Athlon II X4 651 процессорын албан ёсны мэдэгдэл

Шинэ ширээний процессорыг танилцууллаа. Өмнөх үеийнхээ нэгэн адил () нь AMD FM1 холбогчдод зориулсан AMD Lynx платформд багтдаг.

Энэхүү загвар нь 3.0 GHz давтамжтай дөрвөн процессорын цөм, PCI Express 2.0 интерфэйс хянагчтай. AMD Lynx платформын нэг хэсэг болох AMD A line APU-ээс ялгаатай нь шинэ бүтээгдэхүүн нь график цөмөөр тоноглогдоогүй.

Уусмалын дулааны багц нь 100 Вт-ын түвшинд байна. 1000 ширхэгтэй шинэ бүтээгдэхүүний санал болгож буй үнэ нь $92 бөгөөд удахгүй худалдаанд гарах болно. Шинэ процессорын техникийн үзүүлэлтүүдийн хүснэгт дараах байдалтай байна.

Зах зээлийн сегмент

Ширээний компьютер

Бичил архитектур

Үйлдвэрлэлийн процессын стандартууд, nm

CPU залгуур

Физик цөмийн тоо

Нэрлэсэн цагийн давтамж, GHz

L1 кэшийн хэмжээ, КБ

Зааварчилгаа

L2 кэшийн хэмжээ, КБ

Нэгдсэн хянагч

Хос суваг DDR3 санах ой, PCI автобусуудЭкспресс 2.0

Дэмжигдсэн санах ойн модулиуд

Дулааны багц, В

Дэмждэг заавар, технологи

MMX, 3DNow!, SSE, SSE2, SSE3, SSE4a, AMD64, AMD-V, Сайжруулсан вирусын хамгаалалт, PowerNow!

Ойролцоогоор үнэ, доллар

Түгжээгүй үржүүлэгчтэй шинэ AMD A6-3670K болон A8-3870K ширээний APU

AMD нь хоёр шинэ APU-г танилцуулахаар бэлтгэж байна. A6-3670KТэгээд A8-3870K. гол онцлогШинэ зүйл бол түгжээгүй үржүүлэгчийн дэмжлэг бөгөөд энэ нь overclockers параметрүүдийг оновчтой болгоход илүү хялбар болгоно. Тийм ч учраас эдгээр шийдлүүдийн нэрэнд "К" дагаварыг ашигладаг. Intel нь түгжээгүй үржүүлэгчтэй процессоруудад ижил төстэй тэмдэглэгээг ашигладаг гэдгийг санацгаая.

Шинэ APU-ийн техникийн үзүүлэлтүүдийн талаархи дэлгэрэнгүй мэдээлэл AMD A6-3670KТэгээд A8-3870K, дараа нь тэдний гол шинж чанарууд нь дараах байдалтай байна.

    2.7 ГГц ба 3.0 ГГц давтамжтайгаар ажилладаг дөрвөн процессорын цөмийг дэмжих;

    4 MB L2 кэшийг дэмжих;

    DDR3-1866 МГц модулиудыг дэмждэг нэгдсэн хос сувгийн RAM хянагч байгаа эсэх;

    320/400 урсгал процессороос бүрдэх, 444 МГц / 600 МГц давтамжтайгаар ажилладаг нэгдсэн график цөм байгаа эсэх.

Гэсэн хэдий ч шинэ бүтээгдэхүүн хоёулаа Turbo Core технологийг дэмждэггүй бөгөөд тэдгээрийн дулааны багц нь 100 Вт юм. Энэ нь загваруудыг хүлээж болно AMD A6-3670KТэгээд A8-3870Kирэх улиралд худалдаанд гарна.

Шинэ ширээний APU-ийн техникийн үзүүлэлтүүдийн хураангуй хүснэгт AMD A6-3670KТэгээд A8-3870Kиймэрхүү харагдаж байна:

AMD A6-3670K

AMD A8-3870K

Зах зээлийн сегмент

ширээний компьютер

Бичил архитектур

Үйлдвэрлэлийн процессын стандартууд, nm

CPU залгуур

Физик цөмийн тоо

Нэрлэсэн цагийн давтамж, GHz

L1 кэшийн хэмжээ, КБ

Зааварчилгаа

L2 кэшийн хэмжээ, КБ

хос суваг DDR3

Дэмжигдсэн модулиуд

Нэгдсэн график цөм

Брэндийн нэр

AMD Radeon HD 6530D

AMD Radeon HD 6550D

Цагийн давтамж, МГц

Урсгал процессоруудын тоо

Дулааны багц, В

AMD-ээс гурван шинэ гар утасны APU-ийн зарлал

AMD нь шинэ APU-г хөгжүүлэх чиглэлээр идэвхтэй ажиллаж байна. Энэ удаад гурван гар утасны шийдлийн дэлгэрэнгүй мэдээлэл гарч ирэв: AMD A4-3320M, A6-3420MТэгээд A8-3520M. Бүх шинэ бүтээгдэхүүнүүд нь FS1 процессорын залгуурт зориулсан 32 нм AMD K10 бичил архитектур дээр суурилдаг. Тэд Turbo Core технологийг дэмждэг бөгөөд тэдгээрийн дулааны багц нь 35 Вт юм.

Энэхүү загвар нь танилцуулсан APU-ийн цорын ганц хоёр цөмт шийдэл юм. Шинэ бүтээгдэхүүний нэрлэсэн давтамж нь 2 GHz, динамик нь 2.6 GHz юм. Мөн 240 урсгал процессортой, 444 МГц давтамжтайгаар ажилладаг AMD Radeon HD 6480G график цөмөөр тоноглогдсон.

Шийдэл AMD A6-3420MТэгээд AMD A8-3520Mдөрвөн процессорын цөмөөр тоноглогдсон бөгөөд нэрлэсэн давтамж нь 1.4 GHz ба 1.6 GHz, динамик нь 2.4 GHz ба 2.5 GHz түвшинд байна. Нэрлэсэн APU цагийн давтамж нь гэдгийг анхаарна уу AMD A6-3420MЭнэ нь загварын харгалзах үзүүлэлттэй ижил тул эргэлзээтэй байна A6-3400M. Бусад шинэ бүтээгдэхүүний цагийн давтамж нь өмнөх үеийнхээс 100 МГц-ээр ялгаатай байна.

Борлуулалтад гарч буй шинэ бүтээгдэхүүн, тэдгээрийн тооцоолсон үнийн талаар одоогоор мэдээлэл алга байна. Шинэ гар утасны APU-ийн техникийн үзүүлэлтүүдийн нарийвчилсан харьцуулалтын хүснэгт AMD A4-3320M, A6-3420MТэгээд A8-3520Mдараах хэлбэртэй байна:

AMD Sempron X2 190 шинэ төсвийн процессорын зарлал

Зургадугаар сард танилцуулсан процессор нь энэ цувралын сүүлчийн шийдэл биш байх болно, учир нь AMD шинэ загвараа аль хэдийн бэлтгэсэн байна. Үүнийг AMD K10 бичил архитектурт суурилсан 45 нм процессын технологийг ашиглан нэрлэж, хийсэн.

Энэхүү шийдэл нь 2.5 GHz цагийн давтамжтайгаар ажилладаг хоёр процессорын цөмтэй. Шинэ бүтээгдэхүүн нь хос сувгийн DDR2 / DDR3 санах ойн хянагчаар тоноглогдсон бөгөөд нэгдсэн график цөм байхгүй. Энэ загварын дулааны багц нь 45 Вт дотор байна.

Шинэ бүтээгдэхүүн нь 37-40 долларын үнээр худалдаанд гарах бөгөөд зөвхөн OEM компаниудад худалдаалагдах болно. Шинэ төсвийн процессорын нарийвчилсан техникийн үзүүлэлтүүдийн хүснэгт нь дараах байдалтай байна.

Зах зээлийн сегмент

ширээний компьютер

Бичил архитектур

Үйлдвэрлэлийн процессын стандартууд, nm

CPU залгуур

Физик цөмийн тоо

Нэрлэсэн цагийн давтамж, GHz

Хүчин зүйл

L1 кэшийн хэмжээ, КБ

Зааварчилгаа

L2 кэшийн хэмжээ, КБ

Нэгдсэн хянагч

хос суваг DDR2 / DDR3 санах ой

Дотоод автобус

HyperTransport 3

Дулааны багц, В

Дэмждэг заавар, технологи

MMX, 3DNow!, SSE, SSE2, SSE3, SSE4a, Нарийвчилсан битийн зохицуулалт, AMD64, AMD-V, Сайжруулсан вирусын хамгаалалт, Cool’n’Quiet 3.0

Ойролцоогоор үнэ, доллар

Шинэ AMD A4-3300 болон A4-3400 ширээний APU-ийн урьдчилсан захиалгын үнэ тодорхой боллоо.

AMD нь A-цуврал ширээний APU-ийн хүрээг идэвхтэй өргөжүүлсээр байна. Өнөөдрийг хүртэл энэ нь зургаан шийдлийг агуулдаг: эхний хоёр загварзургадугаар сарын сүүлээр танилцуулсан, мөн дараагийн дөрөв- долоо хоногийн өмнө.

Ойрын ирээдүйд дахин хоёр APU гарч ирнэ: ба A4-3400. Шинэ бүтээгдэхүүнүүд хоёулаа 2.5 GHz ба 2.7 GHz давтамжтайгаар ажилладаг хоёр процессорын цөм, DDR3-1600 МГц модулиудыг дэмждэг хоёр сувгийн RAM хянагч, 443 МГц давтамжтай AMD Radeon HD 6410D график цөмтэй. 600 МГц тус тус.

Зарим онлайн дэлгүүрүүд аль хэдийн APU болон A4-3400Тэдний үнийн жагсаалтад $73.52 / $79.25 ("Тасгуур" хувилбар) болон $78.78 / $84.92 ("Хайрцаг" хувилбар) гэсэн тооцоолсон үнээр. Өмнөх шийдлүүдийн үнийн түүхийг авч үзэх AMD цувралА, шинэ бүтээгдэхүүний албан ёсны үнэ нь загварт $65, APU-д $70 орчим хэлбэлзэнэ гэж бид таамаглаж болно. AMD A4-3400.

Шинэ ширээний компьютерын техникийн үзүүлэлтүүдийн харьцуулсан хүснэгт ба A4-3400дараах хэлбэртэй байна:

Шинэ AMD A-line процессорууд аль хэдийн худалдаанд гарсан байна

AMD-ийн албан ёсны үнийн жагсаалтыг нэн даруй дөрвөн шинэ шийдлээр дүүргэв: гурван APU ( A6-3500, A6-3600, A8-3800) болон нэг процессор Athlon II X4 631. Бүх шинэ бүтээгдэхүүнүүд нь 32 нм AMD K10 бичил архитектур дээр суурилсан бөгөөд AMD A цувралд багтдаг. Бид эхний гурван процессорын талаар дэлгэрэнгүй авч үзсэн. өмнөх материалуудын нэг, тиймээс энэ удаад шийдлийг нарийвчлан авч үзье.

Энэхүү загвар нь AMD A-ийн "Athlon" брэндийн нэрийг ашигласан анхны загвар юм, гэхдээ AMD энэ нэрээ бүрмөсөн орхих хүсэлтэй байгаа талаар өмнө нь мэдээлж байсан. Шинэ бүтээгдэхүүн нь дөрвөн процессорын цөмтэй, хос сувгийн DDR3 RAM хянагч, PCI Express 2.0 интерфэйс хянагчтай. Процессорын нэрлэсэн давтамж нь 2.6 GHz бөгөөд Turbo Core технологийг дэмждэггүй тул дээр дурдсан үзүүлэлт нь динамикаар өөрчлөгдөх боломжгүй юм. Түүнчлэн нэгдсэн график цөм байхгүй гэдгийг тэмдэглэх нь зүйтэй. Үүний зэрэгцээ шинэ бүтээгдэхүүний дулааны багц нь 100 Вт бөгөөд 1000 ширхэг багцаар санал болгож буй үнэ нь 79 доллар юм.

Шинэ процессор болон APU шугамын техникийн үзүүлэлтүүдийн харьцуулсан хүснэгт AMD Адараах хэлбэртэй байна:

Шинэ AMD A цувралын APU-ийн урьдчилсан захиалгын үнэ тодорхой байна

6-р сарын сүүлээр уг шугамын анхны төлөөлөгчид ("Llano") AMD ширээний процессоруудын эгнээнд гарч ирэв. Та бүхний мэдэж байгаагаар гуравдугаар улиралд тэдний тоо мэдэгдэхүйц нэмэгдэх ёстой. Худалдаанд гарах шинэ АПУ-уудын эхнийх нь шийдэл юм AMD A6-3600 ба AMD A8-3800.

APU нь 2.1 GHz нэрлэсэн давтамжтай ажилладаг гурван цөмт загвар гэдгийг санаарай. Turbo Core горимд энэ үзүүлэлт автоматаар 2.4 GHz хүртэл нэмэгдэж болно. Энэхүү шийдэл нь мөн хос сувгийн DDR3-1866 MHz RAM хянагч, PCI Express 2.0 автобусны хянагч, AMD Radeon HD 6530D график цөмтэй.

Загвар AMD A6-3600ижил төстэй шинж чанартай боловч дөрвөн цөмөөр тоноглогдсон. АПУ AMD A8-3800Энэ нь мөн дөрвөлсөн цөмт, илүү өндөр цагийн хурд, RAM болон PCI Express 2.0 хянагч, сайжруулсан AMD Radeon HD 6550D график цөмтэй. Гурван шинэ бүтээгдэхүүний дулааны багц нь 65 Вт түвшинд байна.

Хэд хэдэн онлайн дэлгүүрүүд дээр дурдсан шинэ барааг борлуулалтын өмнөх жагсаалтад аль хэдийн оруулсан болохыг анхаарна уу. Тодруулбал, уг загвар нь 104.22 ам.долларын үнээр худалдаанд гарах юм байна. AMD A6-3600– 126.87 доллар, шийдэл AMD A8-3800 150.16 доллараар үнэлэгдэх төлөвтэй байна. Өөр өөр дэлгүүрүүдэд ижил загваруудын үнэ ердөө 3-6 доллараар хэлбэлзэж байгааг харгалзан үзвэл холбогдох үзүүлэлтүүд тогтоосон түвшинд хэвээр үлдэнэ гэж таамаглаж болно.

АПУ-ийн шинэ шугамын хураангуй техникийн үзүүлэлт AMD Адараах хүснэгтэд үзүүлэв.

Эхлээд шинэ AMD A8-3870 APU-г хараарай

Мэдэгдэж байгаагаар AMD шинэ APU-г нэвтрүүлэхээр төлөвлөж байна A8-3870. Үүний гол давуу тал нь түгжээгүй үржүүлэгч байх бөгөөд энэ нь сонирхогчдод энэхүү шинэ бүтээгдэхүүний шинж чанарыг оновчтой болгоход хялбар болгоно.

Загварын бусад техникийн нарийн ширийн зүйлсийн хувьд AMD A8-3870, дараа нь тэдний дунд дэмжлэгийг тэмдэглэх нь зүйтэй:

    3.1 GHz нэрлэсэн давтамжтайгаар ажилладаг дөрвөн физик цөм;

    DDR3-1866 МГц модулиудыг дэмждэг хоёр сувгийн RAM хянагч;

    400 урсгал процессор агуулсан, 600 МГц давтамжтайгаар ажилладаг AMD Radeon HD 6550D график цөм.

Шинэ бүтээгдэхүүн энэ оны дөрөвдүгээр улиралд худалдаанд гарна гэж найдаж болно. Шинэ техникийн үзүүлэлтүүдийн хураангуй хүснэгт APU AMD A8-3870дараах байдлаар:

AMD A8-3870

Зах зээлийн сегмент

ширээний компьютер

Бичил архитектур

Үйлдвэрлэлийн процессын стандартууд, nm

CPU залгуур

Физик цөмийн тоо

Нэрлэсэн цагийн давтамж, GHz

L1 кэшийн хэмжээ, КБ

Зааварчилгаа

L2 кэшийн хэмжээ, КБ

Нэгдсэн RAM хянагч

хос суваг DDR3

Нэгдсэн график цөм

Брэндийн нэр

AMD Radeon HD 6550D

Цагийн давтамж, МГц

Урсгал процессоруудын тоо

Дулааны багц, В

Зах зээлд гарах ойролцоогоор хугацаа

2011 оны 4-р улирал

Гурван цөмт APU AMD A6-3500 ширээний компьютерын анхны туршилт

Эхлээд шинэ AMD A4-3300 ширээний APU-г хараарай

Шинэ ширээний APU-ийн анхны дэлгэрэнгүй мэдээлэл гарч ирэв. Энэ нь 2.5 GHz цагийн давтамжтайгаар ажилладаг хоёр цөмтэй. Үүний зэрэгцээ шинэ бүтээгдэхүүн нь хувийн Turbo Core технологийг дэмждэггүй тул энэ үзүүлэлтийг динамикаар өөрчлөх боломжгүй юм.

Энэ цувралын өөр нэг алдартай төлөөлөгч болох АПУ шиг AMD A4-3400- загвар A4-3300Мөн DDR3-1600 МГц модулиудыг дэмждэг хоёр сувгийн RAM хянагч, 443 МГц давтамжтай AMD Radeon HD 6410D график цөмөөр тоноглогдсон. Энэ тохиолдолд уусмалын дулааны багц A4-3300 65 Вт байна.

Шинэ бүтээгдэхүүн энэ улирал дуусахаас өмнө худалдаанд гарна гэж бид найдаж байна. Шинэ ширээний APU-ийн техникийн үзүүлэлтүүд дараах байдалтай байна.

Зах зээлийн сегмент

ширээний компьютер

Бичил архитектур

Үйлдвэрлэлийн процессын стандартууд, nm

CPU залгуур

Физик цөмийн тоо

Нэрлэсэн цагийн давтамж, GHz

L1 кэшийн хэмжээ, КБ

Зааварчилгаа

L2 кэшийн хэмжээ, КБ

Нэгдсэн RAM хянагч

хос суваг DDR3

Дэмжигдсэн модулиудын цагийн давтамж, МГц

Нэгдсэн график цөм

Брэндийн нэр

AMD Radeon HD 6410D

Цагийн давтамж, МГц

Урсгал процессоруудын тоо

Дулааны багц, В

Дэмждэг заавар, технологи

MMX, 3DNow!, SSE, SSE2, SSE3, SSE4a, AMD64, AMD-V, Сайжруулсан вирусын хамгаалалт

Гурван цөмт шинэ AMD A6-3500 APU-ийн зарлал

Энэ оны 3-р улиралд AMD-ийн ширээний APU-ийн цувралыг хэд хэдэн шинэ бүтээгдэхүүнээр өргөжүүлэх ёстой бөгөөд эдгээрийн дотор гурван цөмт шийдлүүдийн эхнийх нь байх болно. A6-3500. Шинж чанаруудын хувьд шинэ бүтээгдэхүүн нь дөрвөн цөмт загвартай бараг ижил юм AMD A6-3600 :

    нэрлэсэн үндсэн цагийн хурд төв процессор 2.1 GHz;

    Turbo Core горимд энэ үзүүлэлт 2.4 GHz хүртэл нэмэгдэх боломжтой;

    график цөм нь 320 урсгал процессороор тоноглогдсон, 443 МГц давтамжтайгаар ажилладаг AMD Radeon HD 6530D шийдлийг ашигладаг;

    DDR3-1866 MHz стандарт модулиудын хос сувгийн горимд ажиллахыг дэмждэг;

    Дулааны багц нь 65 Вт.

Дээрх параметрүүдийг авч үзвэл уг загварыг AMD A6-3600 шийдэлд нэг цөмийг хаах замаар үйлдвэрлэсэн гэж үзэж болно. Хэрэв үүнтэй зэрэгцэн AMD-ийн инженерүүд хэрэглэгчдэд энэ цөмийг нээх боломжийг үлдээвэл APU нь арилжааны томоохон амжилт болж чадна.

Шинэ APU-ийн техникийн үзүүлэлтүүдийн нарийвчилсан хүснэгт дараах байдалтай байна.

Зах зээлийн сегмент

ширээний компьютер

Бичил архитектур

Үйлдвэрлэлийн процессын стандартууд, nm

CPU залгуур

Физик цөмийн тоо

Нэрлэсэн цагийн давтамж, GHz

Turbo Core горим дахь цагийн давтамж, GHz

L1 кэшийн хэмжээ, КБ

Зааварчилгаа

L2 кэшийн хэмжээ, КБ

Нэгдсэн RAM хянагч

хос суваг DDR3

Дэмжигдсэн модулиудын цагийн давтамж, МГц

Нэгдсэн график цөм

Брэндийн нэр

AMD Radeon HD 6530D

Цагийн давтамж, МГц

Урсгал процессоруудын тоо

Дулааны багц, В

Дэмждэг заавар, технологи

MMX, 3DNow!, SSE, SSE2, SSE3, SSE4a, AMD64, AMD-V, Сайжруулсан вирусын хамгаалалт, Turbo Core

AMD Phenom II X4 960T Black Edition – Турбо цөмийн дэмжлэгтэй шинэ дөрвөн цөмт процессор

Өнгөрсөн оны гуравдугаар улиралд AMD нь "Zosma" кодтой цөм дээр суурилсан анхны AMD Phenom II X4 цуврал процессоруудыг зарлав. Үндсэндээ эдгээр нь AMD-ийн "Thuban" шийдлүүдийн хялбаршуулсан хувилбарууд байсан бөгөөд үүнд хоёр цөм болон тохирох хэмжээний L2 кэш түгжигдсэн байв. Энэ цагийг хүртэл Zosma кодын цөм бүхий процессоруудыг зөвхөн OEM компаниудад нийлүүлдэг байв.

Гэсэн хэдий ч саяхан Японы хэд хэдэн дистрибьюторууд бөөнөөр нь борлуулах зорилготой процессоруудыг хүлээн авч эхэлсэн. Шинэ бүтээгдэхүүнүүд нь дөрвөн цөмтэй бөгөөд 45 нм процессын технологи ашиглан AMD K10 бичил архитектурт суурилсан. Мөн сүүлийн дөрвөн тэмдэгт ( 4DGR) бүтээгдэхүүний дугаарт ( D96ZTWFK4DGR) дээр дурдсан AMD "Zosma" цөмийг ашиглахыг заана.

Процессорууд нь хэрэглэгчдэд ээлтэй гурван онцлогтой. Нэгдүгээрт, тэд Turbo Core-ийн өмчийн технологийг дэмждэг бөгөөд энэ нь процессор нь хэд хэдэн цөмийн цагийн хурдыг 3.0 GHz-ээс 3.4 GHz хүртэл нэмэгдүүлэх боломжийг олгодог. Хоёрдугаарт, түгжигдсэн хоёр цөмийг тайлж болно. Тиймээс хэрэглэгч дөрвөн цөмт процессор худалдаж авснаар бүрэн ажиллагаатай зургаан цөмт шийдлийг авах боломжтой. Гуравдугаарт, загвар AMD Phenom II X4 960Tцуврал руу буцах болно" Хар хэвлэл", энэ нь энэхүү шинэ бүтээгдэхүүнийг оновчтой болгох өндөр чадамжийг харуулж байна.

Шинэ процессорын техникийн үзүүлэлтүүдийн хүснэгт дараах байдалтай байна.

AMD Sempron 130 – шинэ төсвийн процессор

45 нм процессын технологийг ашиглан AMD K10 микро архитектурын үндсэн дээр угсарсан төсвийн шинэ процессор гарч ирэв. Шинэ бүтээгдэхүүн нь аль хэдийн алдартай онлайн дэлгүүрүүдийн нэгэнд 29.99 долларын үнээр худалдаалагдаж байна (тавагт хувилбар). Процессор нь 2.6 GHz давтамжтай нэг цөмтэй бөгөөд 512 KB L2 кэштэй.

Энэхүү загвар нь цувралынхаа хамгийн бага бүтээмжтэй шийдэл гэдгийг анхаарна уу. Гэхдээ өөр цөмийн түгжээг тайлах процедурыг амжилттай дуусгасны дараа энэ процессорыг CPU-Z хэрэгсэл нь AMD Athlon II X2 430 хоёр цөмт загвар гэж хүлээн зөвшөөрсөн.

Цуглуулгын шүтэн бишрэгчид ч шинэ бүтээгдэхүүнийг сонирхож магадгүй юм. Та бүхний мэдэж байгаагаар AMD нь зах зээлийн төсвийн сегмент дэх AMD E цуврал APU дээр анхаарлаа төвлөрүүлж, AMD Sempron шугамын шинэ загваруудыг хөгжүүлэх, үйлдвэрлэхээ зогсоож байгаа тул процессор нь энэ шугамын хамгийн сүүлийн шийдэл болж магадгүй юм.

Шинэ төсвийн процессорын техникийн үзүүлэлтүүдийн хүснэгт дараах байдалтай байна.

Зах зээлийн сегмент

ширээний компьютер

Бичил архитектур

Үйлдвэрлэлийн процессын стандартууд, nm

CPU залгуур

Физик цөмийн тоо

Нэрлэсэн цагийн давтамж, GHz

Хүчин зүйл

L1 кэшийн хэмжээ, КБ

Зааварчилгаа

L2 кэшийн хэмжээ, КБ

Нэгдсэн хянагч

хос суваг DDR2 / DDR 3 санах ой

Дотоод автобус

Гипер тээврийн 3

Дэмждэг заавар, технологи

MMX, 3DNow!, SSE, SSE2, SSE3, SSE4a, Нарийвчилсан битийн зохицуулалт, AMD64, AMD-V, Сайжруулсан вирусын хамгаалалт, Cool"n"Quiet 3.0

Дараагийн үеийн бичил архитектурын тухай анх 2003 онд форум дээр гарч ирэв Микропроцессорын форум 2003. Шинэ бичил архитектурт 10 ГГц хүртэлх цагийн хурдтай ажиллах олон цөмт процессорууд орно гэж тэмдэглэв. Дараа нь цагийн давтамжийг хэд хэдэн удаа багасгасан. 2009 он хүртэлх хугацаанд нийтлэгдсэн стратегийн төлөвлөгөөнд 5-р сард AMD-ийн дөрвөлсөн цөмт процессоруудыг хөгжүүлэх тухай албан ёсны анхны дурдагдсан байдаг.

Үнэн бол тэр үед шинэ бичил архитектурыг AMD K8L код нэрээр жагсаасан бөгөөд зөвхөн 2007 оны 2-р сард AMD K10 эцсийн нэрийг баталсан.

Сайжруулсан AMD K8 архитектурт суурилсан процессорууд нь анхны дөрвөлсөн цөмт AMD процессорууд болохоос гадна зах зээл дээрх бүх 4 цөм нь нэг чип дээр байрладаг анхны процессорууд байх ёстой байв (өмнө нь 4 цөм нь нэг чип дээр байрладаг. хоёр цөмт Opteron талстууд болох дөрвөн цөмт AMD процессор).

Архитектурын онцлог

AMD K8 дээр суурилсан K10 үеийн процессорууд болон тэдгээрийн өмнөх үеийн процессоруудын гол ялгаа нь нэг чип дээрх дөрвөн цөм, Hyper-Transport протоколын 3.0 хувилбарт шинэчлэлтүүд, бүх цөмд зориулсан нийтлэг L3 кэш, түүнчлэн ирээдүйтэй дэмжлэг юм. DDR3 санах ойн хянагч. Цөмүүд нь мөн AMD-н K8 цөмүүдээс шинэчлэгдсэн.

Шууд холболтын архитектур

  • Санах ойн хянагч болон оролт гаралтын сувгийг цөмд шууд холбох замаар гүйцэтгэл, үр ашгийг нэмэгдүүлэх боломжийг танд олгоно.
  • 32 болон 64 битийн тооцооллыг нэгэн зэрэг гүйцэтгэх зориулалттай.
  • DDR2 санах ойн хянагчийг нэгтгэх (533 (1066) МГц хүртэл горим, түүнчлэн DDR3-ийн ирээдүйн дэмжлэг)

Давуу тал:

  • Санах ойн хандалтын хоцролтыг багасгах замаар програмын гүйцэтгэлийг нэмэгдүүлнэ
  • Хүсэлт дээр үндэслэн санах ойн зурвасын өргөнийг хуваарилдаг
  • Hyper-Transport технологи нь хоцролтоос урьдчилан сэргийлэхийн тулд холболтыг 16.0 ГБ/сек хүртэл дээд хурдаар хангадаг.
  • Нийт 33.1 ГБ/сек хүртэл зурвасын өргөнпроцессор ба системийн хооронд (Hyper-Transport автобус болон санах ойн хянагч орно)

AMD тэнцвэртэй ухаалаг кэш

Нэг цөмд 512KB L2 кэшээс гадна 2MB L3 кэшийг бүх цөмд хуваалцдаг. Үр ашиг нь гүйцэтгэлийг сайжруулахын тулд байнга ашиглагддаг өгөгдөлд хандах үед хоцролтыг багасгадаг.

AMD өргөн хөвөгч цэгийн хурдасгуур

Нэг цөмд 128 битийн FPU. Давуу тал нь хөвөгч цэгийн тооцоололд өгөгдлийг хурдан түүвэрлэх, боловсруулах явдал юм.

HyperTransport

  • 4000 MT/s хурдтай 16 битийн нэг суваг
  • Hyper-Transport 3.0 горимд ажиллах үед 8.0 ГБ/с, 16.0 ГБ/с хүртэл дээд хурдтай Hyper-Transport холболт
  • Процессор ба системийн хоорондох нийт зурвасын өргөн 33.1 ГБ/сек хүртэл (Hyper-Transport автобус болон санах ойн хянагч орно)

Нэгдсэн санах ойн хянагч

Давуу тал - хурдан нэвтрэхгүйцэтгэлийг нэмэгдүүлэхийн тулд системийн нөөцөд .

AMD-V

Одоогийн болон ирээдүйн виртуалчлалын орчинд гүйцэтгэл, найдвартай байдал, аюулгүй байдлыг сайжруулахад зориулагдсан техник хангамжид суурилсан функцүүдийн багц. виртуал машинуудхуваарилагдсан санах ойд шууд хандах

Cool'n'Quiet 2.0

  • Процессорын ажиллагааг ачааллаас хамааран автоматаар тохируулдаг эрчим хүчний удирдлагын дэвшилтэт систем
  • Сул зогсолтын үед цахилгаан зарцуулалт багасч, эргэлтийн хурд багасна

CoolCore

  • Процессорын ашиглагдаагүй хэсгүүдийг унтрааснаар эрчим хүчний хэрэглээг багасгах боломжийг танд олгоно.
  • Санах ойн хянагч болон процессорын логикийн тусдаа систем нь бие биенээсээ хамааралгүйгээр хүчдэлийг хянах, унтраах боломжийг олгодог
  • Драйвер болон BIOS-ийн дэмжлэг шаардлагагүйгээр автоматаар ажиллана
  • Цөм бүрийн давтамжийг бие даан хянах боломжийг олгодог
  • Үйлдлийн горимыг солих хурд нь процессорын цөмийн нэг мөчлөгтэй тэнцүү байна

TLB алдаа

Үзүүлэлтүүд

  • Процессын технологи: 65нм SOI
  • үндсэн талбай: 283 мм²
  • транзисторын тоо: 450 сая
  • хүчдэл: 1.05-1.38V
  • Сокет: AM2+ (940 зүү) / Сокет F (1207 зүү)

Сонголтууд

Ширээний компьютерт зориулсан

Ширээний системд зориулсан Phenom процессор, мөн Socket AM2+ залгуурт зориулсан Opteron 13xx цуврал. Phenom цувралын бүх процессорууд нь Socket AM2-тэй хоцрогдсон нийцтэй Socket AM2+ дээр бүтээгдсэн. Socket AM2-г дэмждэг эх хавтан дээр Phenom процессоруудыг ашиглахдаа Hyper-Transport 3.0 автобусны дэмжлэг, санах ойн хянагч (хойд гүүр), L3 кэш болон цөмүүдийн тусдаа цаг, мөн эрчим хүч хэмнэх зарим функцүүд алга болдог.

Серверүүдийн хувьд

Серверүүдэд зориулсан Opteron 83xx болон 23xx цувралууд.

Opteron цуврал процессорууд нь Socket F дээр суурилсан хуучин эх хавтан дээр ажиллах боломжтой болно. Аль ч тохиолдолд та зөвхөн BIOS-ийг шинэчлэх хэрэгтэй эх хавтан. Эдгээр бүх процессорууд нь AMD64 архитектур дээр суурилагдсан бөгөөд 32 битийн x86, 16 бит, AMD64 кодтой ажиллах чадвартай.

K10-ийн анхны цөм нь серверт зориулагдсан процессоруудад зориулагдсан "Барселона" гэсэн кодтой. Хожим нь ширээний компьютерт зориулсан процессорууд гарсан бөгөөд K10 цөмийг "Agena" гэж нэрлэжээ.

K10 цөмтэй процессорууд

AMD-ийн төрөл зүйлд K10 үеийн процессорууд гарч ирснээр тэдгээрийн тэмдэглэгээ бас өөрчлөгдсөн - K10 ба AMD K8 дээр суурилсан загвар хоёулаа шинэ нэрийн дор нуугдаж байна.

AMD процессорын тэмдэглэгээний систем
Процессорын цуврал Зориулалт
Phenom X4 дөрвөн цөмт ( Агена) X4 9хх0
Phenom X3 гурван цөмт ( Толиман) X3 8хх0
Athlon хоёр цөмт ( Кума) 7хх0
Атлон нэг цөмт ( Лима) 1хх0
Sempron нэг цөмт ( Спарта) 1хх0

Барселона гол

  • AMD Opteron 3G 8350, 4 цөм, 2.0 GHz, 75 Вт
  • AMD Opteron 3G 8347, 4 цөм, 1.9 GHz, 75 Вт
23хх
  • AMD Opteron 3G 2350, 4 цөм, 2.0 GHz, 75 Вт
  • AMD Opteron 3G 2347, 4 цөм, 1.9 GHz, 75 Вт
  • AMD Opteron 3G 8356, 4 цөм, 2.3 GHz, 75 Вт
  • AMD Opteron 3G 8354, 4 цөм, 2.2 GHz, 75 Вт
23хх
  • AMD Opteron 3G 2356, 4 цөм, 2.3 GHz, 75 Вт
  • AMD Opteron 3G 2354, 4 цөм, 2.2 GHz, 75 Вт
  • AMD Opteron 3G 2352, 4 цөм, 2.1 GHz, 75 Вт
13хх
  • AMD Opteron 3G 1356, 4 цөм, 2.3 GHz, 75 Вт
  • AMD Opteron 3G 1354, 4 цөм, 2.2 GHz, 75 Вт
  • AMD Opteron 3G 1352, 4 цөм, 2.1 GHz, 75 Вт
  • AMD Opteron 3G 8347 HE, 4 цөм, 1.9 GHz, 55 Вт
  • AMD Opteron 3G 8346 HE, 4 цөм, 1.8 GHz, 55 Вт
23хх
  • AMD Opteron 3G 2347 HE, 4 цөм, 1.9 GHz, 55 Вт
  • AMD Opteron 3G 2346 HE, 4 цөм, 1.8 GHz, 55 Вт
  • AMD Opteron 3G 2344 HE, 4 цөм, 1.7 GHz, 55 Вт
  • AMD Opteron 3G 8360 SE, 4 цөм, 2.5 GHz, 95 Вт
  • AMD Opteron 3G 8358 SE, 4 цөм, 2.4 GHz, 95 Вт
23хх
  • AMD Opteron 3G 2360 SE, 4 цөм, 2.5 GHz, 95 Вт
  • AMD Opteron 3G 2358 SE, 4 цөм, 2.4 GHz, 95 Вт