AMD Piledriver болон K10: Толгойгоороо. Шинэ AMD процессорууд
2000-аад оны эхэн үеийн нээлтийн дараа AMD аюулгүйгээр буцаж ирэв хэвийн байдалүргэлж гүйцэж, хэдий ч нэлээд сонирхолтой, эргэлзээгүй дэвшилтэт техникийн шийдлүүд, борлуулалтаараа Intel-тэй өрсөлдөхийг оролддоггүй. 2009 оны дунд үеийн байдлаар тус компанийн хувь хэмжээ микропроцессорын зах зээлийн 14.5 орчим хувийг эзэлж байна. Үүний зэрэгцээ, нэгэн цагт AMD чипүүдийн өмчлөлийн "онцлогууд" - жишээлбэл, 64 битийн зааврын өргөтгөлүүд эсвэл процессорт суурилуулсан хянагч. санамсаргүй хандалт санах ой- гол өрсөлдөгчийн чипүүдэд удаан хугацаагаар ашиглагдаж ирсэн.
Өнөөдөр AMD-ийн бүтээгдэхүүнүүд маш нарийн хоёр цэгийг эзэлдэг: эдийн засгийн зэрэглэлийн компьютер бүтээхэд зориулагдсан хэт төсөвт процессорууд болон харьцуулсан Intel чипээс 3-5 дахин хямд үнэтэй өндөр хүчин чадалтай загварууд.
Энэ нь дэлгүүрийн тавиур дээр янз бүрийн гэр бүл, үеийн AMD процессоруудыг олж болно гэдгийг тайлбарлаж байна - эртний үеийн Sempron, Athlon, Socket 939 залгуурт зориулсан K8 архитектурт суурилсан хэт орчин үеийн зургаан цөмт Phenom II X6 хүртэл. Гэсэн хэдий ч AMD одоо K10 архитектурт найдаж байгаа тул бид түүний үндсэн дээр боловсруулсан процессоруудын талаар тусгайлан ярих болно. Үүнд Phenom болон Phenom II, түүнчлэн Athlon II гэж нэрлэгддэг төсвийн хувилбарууд багтана.
Түүхээс харахад K10-д суурилсан анхны чипүүд нь 2007 оны 11-р сард гарсан дөрвөлсөн цөмт Phenom X4 (код нэртэй Agena) байв. Хэсэг хугацааны дараа буюу 2008 оны 4-р сард гурван цөмт Phenom X3 гарч ирэв - дэлхийн анхны төв процессорууд. ширээний компьютерууд, гурван цөм нь нэг чип дээр байрладаг. 2008 оны 12-р сард 45 нанометрийн процессын технологид шилжсэнээр шинэчлэгдсэн Phenom II гэр бүлийг нэвтрүүлж, 2-р сард чипүүд нь шинэ Socket AM3 холбогчтой болсон. Дөрвөн цөмт Phenom II X4 2009 оны 1-р сард, гурвалсан цөмт Phenom II X3 2009 оны 2-р сард, хоёр цөмт Phenom II X2 2009 оны 6-р сард, 6 цөмт Phenom II X2 дөнгөж саяхан буюу 4-р сард цуврал үйлдвэрлэгдэж эхэлсэн. 2010 он.
Athlon II - Sempron-ийн орчин үеийн орлуулалт нь Phenom II бөгөөд хамгийн чухал давуу талуудын нэг болох гурав дахь түвшний том кэш (L3), бүх цөмд нийтлэг байдаг. Хоёр, гурав, дөрвөн цөмт хувилбартай. Athlon II X2 нь 2009 оны 6-р сараас, X4 нь 2009 оны 9-р сараас, X3 нь 2009 оны 11-р сараас эхлэн үйлдвэрлэгдэж байна.
AMD K10 архитектур
K10 болон K8 архитектурын үндсэн ялгаа нь юу вэ? Юуны өмнө K10 процессоруудад бүх цөм нь нэг чип дээр хийгдсэн бөгөөд тусгай L2 кэшээр тоноглогдсон байдаг. Phenom/Phenom 2 болон серверийн Opteron чипүүд нь бүх цөмд зориулсан нийтлэг L3 кэш санах ойг хангадаг бөгөөд хэмжээ нь 2-6 МБ хооронд хэлбэлздэг.
K10-ийн хоёр дахь гол давуу тал бол 32 битийн горимд хоёр чиглэлд 41,6 ГБ/с хүртэл хурдтай, 16 битийн горимд нэг чиглэлд 10,4 ГБ/с хүртэл хурдтай, давтамжтай шинэ HyperTransport 3.0 системийн автобус юм. 2.6 GHz хүртэл. Хамгийн их ажиллах давтамж гэдгийг санаарай өмнөх хувилбар HyperTransport 2.0 нь 1.4 GHz, хамгийн дээд хурд нь 22.4 буюу 5.6 ГБ/сек хүртэл байна.
Өргөн автобус нь олон цөмт процессоруудад онцгой ач холбогдолтой бөгөөд HyperTransport 3.0 нь сувгийн тохиргоог хангаж, цөм бүр өөрийн бие даасан эгнээтэй байх боломжийг олгодог. Нэмж дурдахад K10 процессор нь автобусны өргөн ба ажиллах давтамжийг өөрийн давтамжтай пропорциональ динамикаар өөрчлөх чадвартай.
Одоогоор AMD чип дээр HyperTransport 3.0 автобус нь зөвшөөрөгдөх дээд хэмжээнээс хамаагүй бага хурдтай ажиллаж байгааг тэмдэглэх нь зүйтэй. Загвараас хамааран 1.6 GHz ба 6.4 ГБ/с, 1.8 ГГц ба 7.2 ГБ/с, 2 ГГц ба 8.0 ГБ/с гэсэн гурван горимыг ашигладаг. Үйлдвэрлэсэн чипүүд нь 2.4 GHz ба 9.6 ГБ/с, 2.6 ГГц ба 10.4 ГБ/с гэсэн хоёр стандарт горимыг хараахан ашиглаагүй байна.
K10 процессорууд нь бие даасан хоёр RAM хянагчийг нэгтгэдэг бөгөөд энэ нь бодит үйл ажиллагааны нөхцөлд модулиудад хандах хандалтыг хурдасгадаг. Удирдлагууд нь DDR2-1066 санах ойтой (AM2+ ба AM3 залгуурт зориулсан загварууд) эсвэл DDR3 (AM3 залгуурт зориулсан чип) ажиллах чадвартай. Socket AM3-д зориулсан Phenom II ба Athlon II-д нэгтгэгдсэн хянагч нь хоёр төрлийн RAM-г дэмждэг бөгөөд AM3 залгуур нь AM2+-тэй хойшоо нийцдэг тул шинэ CPU-үүдийг хуучин AM2+ хавтан дээр суулгаж, DDR2 санах ойтой ажиллах боломжтой. Энэ нь Phenom II-г шинэчлэхийн тулд худалдаж авахдаа эх хавтанг шууд солих эсвэл өөр төрлийн RAM худалдаж авах шаардлагагүй болно, жишээ нь Intel i3/i5/i7 чиптэй адил.
K10 архитектуртай микропроцессорууд нь AMD Cool"n"Quiet, CoolCore, Independent Dynamic Core, Dual Dynamic Power Management зэрэг орчин үеийн эрчим хүчний хэмнэлттэй технологийг бүхэлд нь хэрэгжүүлдэг. Энэ нарийн төвөгтэй системСул зогсолтын горимд бүхэл чипийн эрчим хүчний хэрэглээг автоматаар бууруулах, санах ойн хянагч болон цөмийн бие даасан тэжээлийн удирдлагыг хангах, ашиглагдаагүй процессорын элементүүдийг унтраах чадвартай.
Эцэст нь, цөм нь өөрөө ч мэдэгдэхүйц сайжирсан. Дээж авах, салбар, салбарыг урьдчилан таамаглах, диспетчерийн хэсгүүдийн дизайныг шинэчилсэн бөгөөд энэ нь үндсэн ачааллыг оновчтой болгох, эцсийн дүндээ гүйцэтгэлийг сайжруулах боломжтой болсон. SSE блокуудын өргөнийг 64 битээс 128 бит болгон нэмэгдүүлж, 64 битийн зааврыг нэг болгон гүйцэтгэх боломжтой болж, хоёр нэмэлт SSE4a зааврын дэмжлэгийг нэмсэн (процессорын SSE4.1 ба 4.2 зааврын багцтай андуурч болохгүй). Intel Core).
Opterons (код нэртэй Барселона) сервер болон Phenom X4 ба X3-ийн анхны хувилбаруудад илэрсэн дизайны согогийг дурдах хэрэгтэй - "TLB алдаа" гэж нэрлэгддэг бөгөөд энэ нь нэгэн зэрэг бүх төрлийн нийлүүлэлтийг бүрэн зогсооход хүргэсэн. В2 хувилбарын оптеронууд. Маш ховор тохиолдолд, өндөр ачаалалтай үед L3 кэш TLD блокийн дизайны алдаанаас болж систем тогтворгүй, урьдчилан таамаглах боломжгүй байдаг. Энэ согог нь серверийн системд маш чухал гэж үзсэн тул бүх гаргасан Opterons-ийн тээвэрлэлтийг түр зогсоосон. Desktop Phenoms-д зориулсан тусгай нөхөөсийг гаргасан бөгөөд энэ нь BIOS ашиглан гэмтэлтэй блокыг идэвхгүй болгосон боловч процессорын гүйцэтгэл мэдэгдэхүйц буурсан байна. B3 хувилбар руу шилжсэнээр асуудал бүрэн арилсан бөгөөд ийм чипүүд удаан хугацаанд худалдаанд гараагүй байна.
Одоогийн загварын хүрээ
Хэдийгээр AMD-н шилдэг процессорууд нь Intel-ийн шилдэг загваруудаас эрс доогуур боловч олон тооны үйлдвэрлэсэн хоёр ба дөрвөлсөн цөмт чипүүдийн сегментэд тодорхой хэмжээний паритет удаан хугацаанд хадгалагдан үлджээ. Үүний зэрэгцээ, AMD платформ нь өөрөө мэдэгдэхүйц хямд байдаг - зөвхөн процессор өөрөө төдийгүй эх хавтангийн өртөг багатай байдаг. Хэрэв та Phenom II X3 ба X4 дээрх төсөвт машинуудыг Core i3 дээр суурилсан, арай илүү бүтээмжтэй, гэхдээ бараг хоёр дахин үнэтэй компьютеруудтай харьцуулж үзвэл энэ ялгаа мэдэгдэхүйц байх болно. Хэрэв та илүү их хүчийг золиосолж, Athlon II-г сонговол компьютер нь хагасаас илүү үнэтэй байх болно!
Илүү бүтээмжтэй машинуудын хувьд зөвхөн хамгийн хүчирхэг машинууд нь Core i5-тай өрсөлдөх боломжтой хүчирхэг загварууд Phenom II X4 болон хамгийн сүүлийн үеийн зургаан цөмт X6-г зөвхөн хамгийн залуу дөрвөлсөн цөмт Core i7-тэй зөв харьцуулж болно.
Бүх үйлдвэрлэсэн Athlon II ба Phenom II нь Socket AM2+-д суулгасан, зөвхөн DDR2 RAM-тай ажилладаг Phenom II X4 940 ба 920 гэсэн хоёр загвараас бусад нь AM3 залгуурт суурилуулах зориулалттай. Phenom чипүүд нь зөвхөн AM2 залгуурт зориулагдсан. AM2+ залгуурт зориулсан процессорыг AM3 залгуурт суулгах боломжгүй, гэхдээ дээр дурдсанчлан AM3 чипийг AM2+ залгууртай хавтан дээр суулгаж болно.
AMD нь Socket AM2-д зориулсан чипүүдийг аажмаар хасаж байгаа бөгөөд Intel-тэй адил илүү орчин үеийн DDR3 RAM дэмждэг загваруудад найдаж байгаа бололтой. Цагийн давтамж болон бусад шинж чанараараа ижил төстэй AM3 ба AM2+ загварууд нь бараг ижил үнэтэй бөгөөд хэрэв та шинэ чипүүдийн хоцрогдсон нийцтэй байдлыг харгалзан үзвэл анхны Phenoms худалдаж авах нь тийм ч чухал биш юм. Тиймээс ирээдүйд бид зөвхөн Phenom II ба Athlon II-ийг авч үзэх болно.
Athlon II болон Phenom II хоёулаа хоёр, гурав, дөрвөн цөмт хувилбарууд (X2, X3, X4), мөн "phenoms" нь зургаан цөмт хувилбарт байдаг. Өөрчлөлт хийх боломжтой Хар хэвлэл, стандартаас онгойлгосон үржүүлэгчээр ялгаатай бөгөөд энэ нь overclocking-ийг хялбаршуулдаг.
Харамсалтай нь ихэнх шинэ AMD чипүүд нь ижил төстэй шинж чанартай Intel загваруудаас дулааны багцын хувьд дахин доогуур байгаа нь хөргөлтийн системд илүү их шаардлага тавьж, эрчим хүчний хэрэглээг нэмэгдүүлдэг гэсэн үг юм. Олон цөмт Phenom II-ийн хувьд ердийн TDP нь 80, 95 эсвэл 125 Вт байна. Загварын индексийн дараа "e" үсэг бүхий тусгай хэмнэлттэй (65 Вт) өөрчлөлтүүд зарагддаг боловч "ердийн" сонголтуудаас мэдэгдэхүйц удаан бөгөөд илүү үнэтэй байдаг.
Athlon II X2 процессорууд нь Phenom II X2 шиг хоёр үхсэн цөмтэй дөрвөн цөмт чип биш харин "жинхэнэ" хоёр цөмт чип юм. Гэхдээ Athlon II X3 бол нэг ажиллагаагүй цөмтэй Athlon II X4 юм. Бүх Athlon II-ийг 45 нм технологи ашиглан үйлдвэрлэдэг.
Athlone X2, X3, X4-ийн цөм бүр нь 128 KB L1 кэш, 512 KB хоёр дахь түвшний кэшээр тоноглогдсон. Гэсэн хэдий ч, Phenom II-ээс ялгаатай нь тэд L3 кэшийг хуваалцдаггүй бөгөөд энэ нь процессорууд илүү удаан кэш рүү хандах болно гэсэн үг юм. системийн санах ой. Үүний үр дүнд нөөц их шаарддаг программуудын гүйцэтгэл хязгаарлагдмал байдаг гурван хэмжээст графикТэгээд Компьютер тоглоом. Гэсэн хэдий ч сайн видео карттай хослуулан Athlon II системүүд нь нэлээд сайн тоглоомын гүйцэтгэлийг харуулдаг.
Phenom II нь Core i3 болон i5-ийн хүчтэй өрсөлдөөнтэй тулгардаг ч тэд харьцуулж болохуйц системийн өртөгийг давсан нь гарцаагүй. Athlon II-ийн нэгэн адил феномын цөм бүр нь 128 КБ L1 кэш, 512 КБ L2 кэштэй. Үүний зэрэгцээ Phenom II нь бүх цөмд нийтлэг байдаг гурав дахь түвшний кэш санах ойг өгдөг. Бараг бүх "үзэгдэл" - хоёр, гурав, дөрөв, зургаан цөмт нь 6 МБ L3 кэштэй бөгөөд 805, 810, 820 индекстэй гурван залуу X4 загвараас бусад нь ердөө 4 МБ L3 L3 санах ойтой. .
Өгүүллийн хоёрдугаар хэсэгт бид танд товч танилцуулах болно суурь мэдээлэлгол зүйлийн талаар техникийн үзүүлэлтОдоогийн байдлаар үйлдвэрлэсэн AMD Athlon II ба Phenom II процессоруудыг Оросын дэлгүүрүүдэд жижиглэнгийн үнээр тооцсон болно. Эцэст нь хэлэхэд бид анхаарлаа хандуулах ёстой хамгийн сонирхолтой загваруудын талаар ярих болно Онцгой анхааралсонгохдоо.
Есдүгээр сарын эхээр AMD компанидөрвөлсөн цөмт K10 архитектурын шинэ процессоруудаа танилцуулахаа амлаж байна. Эдгээр шинэ архитектуртай анхны процессорууд нь Барселона кодтой үндсэн дээр Opteron серверийн чипүүд байх болно. Харамсалтай нь AMD-ийн инженерүүд одоогийн хувилбарт өндөр давтамжтай ажилладаг процессоруудыг олноор нь үйлдвэрлэх боломжгүй байсан. Давтамжийг нэмэгдүүлэхэд тулгарч буй гол бэрхшээл нь өндөр давтамжийн дөрвөн цөм нь платформын дулааны багцад заасан хэмжээнээс давсан эрчим хүч хэрэглэдэг явдал байв. Шинэ хувилбарууд гарч, илүү боловсронгуй техникийн процесст шилжих үед эрчим хүчний хэрэглээ буурч, давтамж нэмэгдэх болно. Энэ хооронд AMD нь эдийн засгийн хүнд байдлаас гарахын тулд борлуулалтаа яаралтай эхлүүлэх шаардлагатай байгаа тул Барселоныг нийлүүлэлт нь 2 ГГц давтамжтай серверийн дөрвөлсөн цөмт процессороор эхлэх болно.2007 оны 4-р улиралд AMD нь Opteron давтамжийг 2.4-2.5 GHz хүртэл нэмэгдүүлж, K10 архитектурын процессоруудын ширээний хувилбаруудыг гаргахаа амлаж байна.
Phenom FX (кодын нэр Agena FX) – 4 цөм, 2 MB L3 кэш, 2.2–2.4 GHz, AM2+ ба F+ залгууруудын тооцоолсон эхлэх давтамж;
Phenom X4 (кодын нэр Agena) – 4 цөм, 2 MB L3 кэш, 2.2–2.4 GHz-ийн тооцоолсон эхлэх давтамж, AM2+ залгуур.
Хожим нь 2008 оны эхээр AMD шинэ процессоруудын хялбаршуулсан хувилбаруудыг нэвтрүүлэхээ амлаж байна.
Phenom X2 (кодын нэр Кума) – 2 цөм, 2 MB L3 кэш, тооцоолсон эхлэх давтамж 2.2–2.6 GHz, залгуур AM2+;
Athlon X2 (кодын нэр Рана) – 2 цөм, L3 кэшгүй, тооцоолсон эхлэх давтамж 2.2 GHz, AM2+ залгуур;
Sempron (код нэр Spica) – 1 цөм, тооцоолсон эхлэх давтамж 2.2–2.4 GHz, AM2+ залгуур.
Гэхдээ энэ бүхэн ойрын ирээдүйн асуудал боловч энэ хооронд AMD-ийн шинэ архитектур ямар шинэлэг зүйл авчирсныг харцгаая. Энэ нийтлэлд би түүний нарийн ширийн зүйлийг нарийвчлан гаргаж, үүнээс юу хүлээж болохыг үнэлэхийг хичээх болно.
Татаж авах заавар
Процессорын кодын гүйцэтгэл нь L1I зааврын кэшээс заавар авч, кодыг нь тайлах замаар эхэлдэг. x86 заавар нь хувьсах урттай тул кодыг тайлахаас өмнө тэдгээрийн хил хязгаарыг тодорхойлоход хэцүү болгодог. Зааврын уртыг тодорхойлох нь код тайлах хурдад нөлөөлөхгүй байхын тулд K8/K10 процессорууд L1I зааврын кэш рүү мөрүүдийг ачаалах үед зааварчилгааг урьдчилан тайлах ажлыг гүйцэтгэдэг. Зааврын байршлын талаарх мэдээллийг L1I кэшэд тусгай талбарт (зааврын байт бүрт 3 битийн код тайлахын өмнөх мэдээлэл) хадгалдаг. Кэш рүү ачаалах үед кодыг урьдчилан тайлах нь зааврын хил хязгаарыг тодорхойлох нэмэлт ачааллыг код тайлах сувгуудаас гадуур зөөж, зааврын урт, бүтцээс үл хамааран тайлах хурдыг тогтмол байлгах боломжийг олгодог.Процессорууд зааврыг кэшээс блок болгон ачаалж, тэдгээрээс зааврыг гаргаж аваад код тайлахаар илгээдэг. K10 архитектурын процессор нь L1I зааврын кэшээс зааврыг 16 байт блокоор татдаг K8 болон Intel Core 2 процессоруудаас ялгаатай нь 32 байт блокуудад тохируулан авдаг. Цаг тутамд 16 байт түүвэрлэлтийн хурд нь K8 болон Core 2 нь цагийн мөчлөг бүрт код тайлахын тулд дунджаар 5 байт хүртэлх таван заавар илгээх боломжийг олгодог. Гэсэн хэдий ч x86 командын урт нь 16 байт хүрч болох ба зарим алгоритмд гинжин хэлхээний хэд хэдэн зэргэлдээх зааврын урт нь 5 байтаас хэтрэх боломжтой бөгөөд энэ нь ийм тохиолдолд нэг цагийн мөчлөгийн гурван зааврыг тайлах боломжгүй болгодог (Зураг 1).
Цагаан будаа. 1. Хэд хэдэн зэргэлдээх урт командууд хурдыг хязгаарладаг
16 байт блокоор түүвэрлэх үед код тайлах
Ялангуяа SSE2-ийн урт нь бүртгэлээс бүртгүүлэх операндуудтай энгийн заавар юм (жишээлбэл, movapd xmm0, xmm1) - 4 байт. Гэсэн хэдий ч, санах ойн хаягийн үйлдлийг ашиглахдаа зааварт үндсэн бүртгэл ба офсет ашиглан (жишээлбэл, movapdxmm0,) командын урт нь офсетээс хамаарч 6-9 байт хүртэл нэмэгддэг. 64 битийн горимд нэмэлт регистр ашиглах үед зааврын кодонд өөр нэг байт REX угтвар нэмэгдэнэ. Тиймээс 64 битийн горимд SSE2 командын урт 7-10 байт хүрч болно. SSE1 командын урт нь вектор заавар (өөрөөр хэлбэл 4-өөс дээш 32 битийн утга) бол 1 байтаар бага боловч скаляр (нэг операнд гаруй) SSE1 заавар нь мөн адил дор 7-10 байт урттай байж болно. нөхцөл.
Цагийн цикл тутамд 16 байт авах нь K8 процессорын хувьд энэ нөхцөл байдалд хязгаарлалт биш юм, учир нь энэ нь 2 цагийн цикл тутамд 3-аас дээш давтамжтайгаар вектор SSE зааврыг тайлж чадахгүй хэвээр байгаа боловч K10 архитектурын хувьд 16 байт түүвэрлэлт болж магадгүй юм. хязгаарлалт тул түүвэрлэлтийн өргөнийг цаг тутамд 32 байт хүртэл өргөжүүлэх нь боломжийн шийдэл юм.
Дашрамд хэлэхэд, Core 2 процессорууд нь K8 процессоруудын нэгэн адил 16 байт блокуудад заавруудыг татаж авдаг тул зааврын дундаж урт нь 4 байтаас хэтрэхгүй тохиолдолд л зааварчилгааны урсгалыг цагт 4 хурдтайгаар үр дүнтэй тайлж чаддаг. нэг цагийн мөчлөгт зөвхөн 4 төдийгүй 3 зааврыг үр дүнтэй боловсруулах боломжгүй болно. Гэсэн хэдий ч Core 2 нь тусгай дотоод 64 байт буфертэй бөгөөд сүүлийн дөрвөн 16 байт блокыг хадгалдаг. Энэ буферээс татан авалтыг нэг цагийн мөчлөгт 32 байт хурдаар гүйцэтгэдэг. Энэхүү буфер нь богино мөчлөгийг кэш хийх, тэдгээрийн түүвэрлэлтийн хурдны хязгаарлалтыг арилгах, мөн мөчлөгийн эхэнд шилжих шилжилтийн таамаглал бүрт 1 цагийн циклийг хэмнэх боломжийг олгодог. Гэсэн хэдий ч гогцоонууд нь 18-аас илүүгүй заавар, 4-өөс илүү болзолт салбар, ret зааваргүй байх ёстой..
Шилжилтийн таамаглал
Командын урсгалд салбарууд гарч ирэхэд процессор нь код тайлалтыг тасалдуулахгүйн тулд програмын цаашдын үйл ажиллагааг таахыг оролдож, хамгийн их магадлалтай салбараас үргэлжлүүлэн тайлах ёстой. Ийм тохиолдолд салбарыг таамаглах механизмыг ашиглан дараагийн зааврын блокыг татаж авдаг. K8 процессор дахь салбаруудын таамаглалыг дасан зохицох хоёр түвшний алгоритм ашиглан гүйцэтгэдэг бөгөөд энэ нь зөвхөн одоогийн заавар төдийгүй өмнөх 8 зааврын салбарын түүхийг харгалзан үздэг. K8 салбарыг урьдчилан таамаглах механизмын гол дутагдал нь динамик байдлаар холбосон хаягтай шууд бус салбаруудыг урьдчилан таамаглаагүй явдал байв.Шууд бус шилжилтүүд нь програмын кодыг гүйцэтгэх үед динамикаар тооцдог заагч ашиглан хийгддэг шилжилтүүд юм. Ихэвчлэн шууд бус үсрэлтүүдийг хөрвүүлэгчид шилжүүлэгч кейсийн бүтцэд оруулдаг бөгөөд мөн объект хандалтат програмчлалын функцийг хаягаар болон виртуал функцүүдийн дуудлагад ашигладаг. K8 процессор нь хамгийн сүүлийн салбар хаягаас код авахыг үргэлж оролддог. Хэрэв хаяг өөрчлөгдсөн бол дамжуулах хоолойг дахин тохируулна. Хэрэв үсрэлтийн хаягийг үе үе холбодог бол процессор байнга алдаа гаргадаг. Шууд бус үсрэлтүүдийн динамикаар өөрчлөгдөж буй хаягийг урьдчилан таамаглах механизм анх Pentium M процессор дээр гарч ирсэн.K8-д ийм механизм байхгүй байгаа нь объект хандалтат код дээр түүний үр нөлөөг бууруулдаг.
Хүлээгдэж буйгаар K10 дахь нөхцөлт салбаруудын таамаглал сайжирсан:
512 элементийн хүснэгтээс урьдчилан таамагласан шууд бус шилжилтийн динамикаар өөрчлөгдөж буй хаягийг урьдчилан таамаглах механизм гарч ирэв.
Өмнөх үсрэх заавруудын дарааллын түүхийг тодорхойлоход ашигладаг дэлхийн түүхийн бүртгэлийн хэмжээг 8-аас 12 бит болгон нэмэгдүүлсэн.
Буцах стекийн гүнийг 12-оос 24 элемент болгон нэмэгдүүлсэн бөгөөд энэ нь функцээс буцах хаягийг хурдан тодорхойлоход хэрэглэгддэг бөгөөд ингэснээр буцах хаягийг стекээс авахын тулд ret командыг хүлээхгүйгээр үргэлжлүүлэн дуудаж болно.
Эдгээр сайжруулалтын ачаар K10 нь өндөр түвшний объект хандалтат хэл дээр бичигдсэн програмуудын гүйцэтгэлийн хурдыг мэдэгдэхүйц нэмэгдүүлэх ёстой. Харамсалтай нь K10 салбарыг урьдчилан таамаглах нэгжийн үр ашгийг бодитойгоор үнэлэх нь нэлээд хэцүү боловч зарим мэдээллээр энэ нь зарим тохиолдолд Intel процессоруудаас доогуур байж болно.
Код тайлах
Зааврын кэшээс хүлээн авсан блокуудыг код тайлах буфер руу хуулдаг ( Урьдчилан кодлох/Буфер сонгох), зааврыг блокуудаас тусгаарласан тохиолдолд тэдгээрийн төрлийг тодорхойлж, холбогдох декодерын суваг руу илгээдэг. Нэг (Ганц) эсвэл хоёр (Давхар) макро үйлдэл болгон задалсан энгийн зааварчилгааг "энгийн" декодлогч руу илгээдэг. Шууд зам. 3 ба түүнээс дээш макро үйлдэлд тайлагдсан нарийн төвөгтэй заавруудыг программ хангамжийн код тайлагч руу илгээдэг. VectorPath.
Цагаан будаа. 2. Декодер
Цагийн мөчлөг бүрт декодерын сувгуудаас 3 макро ажиллагаа (MOP) гарч болно. DirectPath декодлогч нь нэг цагийн мөчлөгт 3 энгийн 1-MOP заавар, эсвэл нэг 2-MOP ба нэг 1-MOP, эсвэл нэг ба хагас 2-MOP зааврыг (хоёр цагийн мөчлөгт гурван 2-MOP зааврыг) тайлж чадна. Нарийн төвөгтэй зааврыг 3-аас дээш MOP-д тайлж болох тул ийм зааврыг тайлах нь хэд хэдэн цагийн мөчлөгийн турш үргэлжилж болно. Декодерын сувгуудын гаралт дээр зөрчил үүсгэхгүйн тулд K8 ба K10 дахь энгийн бөгөөд нарийн төвөгтэй зааврыг код тайлахаар нэгэн зэрэг илгээх боломжгүй.
MOP нь бүхэл тоо эсвэл бодит арифметикийн нэг бичил үйлдэл, санах ойд хандах нэг хаягийн бичил үйлдэл гэсэн хос бичил үйлдлийн системээс бүрдэнэ. MOP-аас бичил үйл ажиллагааг сонгох ажлыг төлөвлөгч гүйцэтгэдэг бөгөөд тэдгээрийг бие биенээсээ хамааралгүйгээр гүйцэтгэхээр илгээдэг.
Цагийн мөчлөг бүр дэх декодчилогчоос гарах MOS гаралтыг 3 бүлэгт нэгтгэдэг. DirectPath болон VectorPath командууд ээлжлэн солигдсон эсвэл код тайлах зааврыг дуудах янз бүрийн саатал зэргээс шалтгаалан декодчилогч дээр 2 эсвэл бүр ердөө 1 MOS агуулсан бүлэг үүсч болно. гаралт. Ийм бүлгийг гурван хүртэлх хоосон MOP-оор дүүргэж, энэ маягтыг гүйцэтгэхэд илгээдэг.
K8 процессор дахь SSE, SSE2, SSE3 вектор зааварчилгааг 64 битийн төхөөрөмж дээрх 128 битийн SSE бүртгэлийн дээд ба доод 64 битийн хагасыг тусад нь боловсруулдаг хос MOP-д хуваадаг. Энэ нь зааврын кодыг тайлах хурдыг хоёр дахин бууруулж, хуваарийн дараалалд орох зааврын тоог хоёр дахин бууруулдаг.
K10 процессор дахь FPU блокуудыг 128 бит хүртэл өргөжүүлсэн тул вектор SSE командуудыг хоёр MOP болгон хуваах шаардлагагүй болно. K8 дээр DirectPath Double гэж тайлагдсан ихэнх SSE зааварчилгааг 1 MOS дээр K10 дээр DirectPath Single гэж тайлж эхэлсэн. Нэмж дурдахад, K8 програмын VectorPath декодлогчоор дамжуулан тайлсан SSE зааврын нэг хэсгийг K10-д энгийн DirectPath декодлогчоор дамжуулан тайлж эхэлсэн бөгөөд үүссэн MOP-ийн тоог 1 эсвэл 2 MOP хүртэл бууруулж (үйл ажиллагаанаас хамааран) ).
Стектэй ажиллах бүхэл тоон зааврын кодыг тайлах ажлыг мөн хялбаршуулсан. CALL-RET болон PUSH-POP функцүүдийн дуудлагад ихэвчлэн хэрэглэгддэг стек зааврын ихэнх хэлбэрийг одоо энгийн декодчилогчоор нэг MOS болгон тайлж байна. Үүнээс гадна эдгээр командууд нь одоо тусгай схемийг ашиглаж байна Sideband Stack Optimizerзэрэгцээ гүйцэтгэх боломжтой макро үйлдлийн бие даасан гинжин хэлхээ болж хувирдаг.
Sideband Stack Optimizer
K10-д Sideband Stack Optimizer хэмээх тусгай блокыг декодерийн хэлхээнд нэмсэн. Үйл ажиллагааны зарчим нь Core процессоруудад хэрэглэгддэг шинэ Stack Pointer Tracker блоктой төстэй юм. Яагаад хэрэгтэй байна вэ? X86 командын багц нь CALL, RET, PUSH, POP командуудыг ашиглан функцийг дуудах, түүнээс гарах, түүнд параметр дамжуулах, регистрүүдийн агуулгыг хадгалахад ашигладаг. Эдгээр бүх заавар нь стекийн одоогийн байрлалыг заадаг ESP бүртгэлийг далд хэлбэрээр ашигладаг. Та K8-д функцийг дуудах үед эдгээр зааврууд хэрхэн биелэгдэж байгааг тэдгээрийн тайлалтыг стекийн бүртгэлийг өөрчлөх, ачаалах/хадгалахтай ижил төстэй энгийн үйлдлүүдийн дараалал гэж төсөөлж харж болно.Энэ жишээнээс харахад функцийг дуудах үед командууд ESP бүртгэлийг дараалан өөрчилдөг тул команд бүр өмнөх үйлдлийн үр дүнгээс шууд хамаардаг. Энэ гинжин хэлхээний командуудыг дахин эрэмбэлэх боломжгүй тул mov eax, командаас эхлэн функцийн бие нь сүүлийн PUSH командыг гүйцэтгэх хүртэл биелэгдэж эхлэх боломжгүй. Sideband Stack Optimizer блок нь стекийн өөрчлөлтийг хянаж, стектэй холбоотой заавар бүрийн офсетийг тохируулж, стекийг тодорхой ашигладаг зааврын өмнө стекийн дээд талын синхрончлолын үйлдлүүдийг (синк-MOP) оруулах замаар гинжийг бие даасан блок болгон хувиргадаг. бүртгүүлэх. Энэ нь стекийг ашигладаг командуудыг дахин эрэмбэлэх хязгаарлалтыг арилгана.
Баг хөдөлж,, үүнээс тооцоолол нь функцийн биед эхэлдэг энэ жишээнд, зөвхөн стекийн дээд талд байгаа синхрончлолын үйлдлээс хамаарна. Одоо эдгээр үйлдлүүдийг өмнө нь байгаа бусад командуудтай зэрэгцүүлэн чөлөөтэй гүйцэтгэх боломжтой. Ийнхүү параметр дамжуулах, регистрийг хадгалах хурд нэмэгдэж, үүний зэрэгцээ функцын байгууллага нь бүх параметрүүдийг дамжуулж, бүртгэлийг хадгалахаас өмнө параметрүүдийг ачаалж, тэдгээртэй үйлдлүүдийг хийж эхлэх боломжтой.
Тиймээс стектэй ажиллах зааварчилгааг тайлах хурдыг нэмэгдүүлэх, Sideband Stack Optimizer блок ашиглах, буцах стекийн гүнийг нэмэгдүүлэх, K10 дахь шууд бус салбаруудыг урьдчилан таамаглах нь функцээр баялаг кодуудын гүйцэтгэлийн хурдыг мэдэгдэхүйц нэмэгдүүлэхэд хүргэдэг. дуудлага.
K10 процессорын декодчилогч нь Core 2 декодлогч нь таатай нөхцөлд хийж чаддаг шиг цагийн мөчлөг бүрт 4 зааврыг тайлж чадахгүй ч энэ нь программыг гүйцэтгэхэд хязгаарлах хүчин зүйл болохгүй. Командын гүйцэтгэлийн дундаж хурд бараг хэзээ ч нэг цагийн мөчлөгт 3 команд хүрдэггүй тул K10 декодер нь дараалалд ажиллахгүйн улмаас тооцоолох нэгжүүд сул зогсохгүй байхын тулд хангалттай үр дүнтэй байх болно.
Командын хяналтын хэсэг
Шифрлэгдсэн MOP гурвалсанууд нь зааварчилгааны хяналтын нэгжид (ICU) ордог бөгөөд энэ нь MOP-уудыг дахин эрэмбэлэх буферт (ROB) хадгалдаг. Дахин эрэмбэлэх буфер нь гурван MOP-ийн 24 мөрөөс бүрдэнэ. MOP гурвалсан бүр өөрийн мөрөнд бичигдсэн байдаг. Ийнхүү ROB нь хяналтын нэгжид 72 MOP-ыг тэтгэвэрт гарах хүртэл нь хянах боломжийг олгодог.Дахин эрэмбэлэх буферээс MOP-ууд нь декодчилогчоос гарах дарааллаар бүхэл тоо болон бодит гүйцэтгэлийн нэгжийн хуваарьт дараалалд илгээгдэнэ. Бүх хуучин үйлдлүүдийг хийж дуусгах хүртэл MOP гурвалсан хэсгүүдийг дахин эрэмбэлэх буферт үргэлжлүүлэн хадгална. Тэтгэвэрт гарах үед эцсийн утгыг архитектурын бүртгэл, санах ойд бичдэг. Үйлдлүүдийг цуцлах, тэдгээрийн талаарх мэдээллийг ROB-ээс устгах, эцсийн утгыг бүртгэх нь дахин эрэмбэлэх буферт орсон үйлдлийн дарааллаар хийгддэг. Энэ нь онцгой тохиолдол эсвэл тасалдсан тохиолдолд дараалсан бүх дараалсан үйлдлүүдийн үр дүнг өөрчлөхөд зайлшгүй шаардлагатай.
Бүхэл тоон командуудыг гүйцэтгэх
K8 ба K10 процессоруудад бүхэл тоон үйлдлийн блок ( Бүхэл тоо гүйцэтгэх нэгж) гурван тэгш хэмтэй бүхэл сувгаас бүрдэнэ. Тооцооллын суваг бүр нь 8 MOS дараалалтай, бүхэл тоон арифметик логик нэгжүүд (ALU), хаягийн нэгжүүд (AGU) болон нөхцөлт салбар нэгж бүхий өөрийн хуваарьтай байдаг. Үүнээс гадна үржүүлэх блок нь тооцооллын суваг 0-д холбогдсон ба LZCNT болон POPCNT шинэ үйлдлүүдийг гүйцэтгэх блок (доор дэлгэрэнгүй) тооцооллын суваг 2-т холбогдсон байна.
Цагаан будаа. 3. Бүхэл тоон үйлдлийг гүйцэтгэх блок
MOP бүрийн дарааллын сонголтыг декодчилогчийн гаралт дээр үүссэн гурвалсан дахь командын статик байрлалаар тодорхойлно. Гурвалсан дахь макро үйлдэл бүрийг дахин эрэмбэлэх буферээс гүйцэтгэхээр илгээдэг бөгөөд энэ нь нэг талаас командын удирдлагыг хялбаршуулж, нөгөө талаас хамааралтай үйлдлүүдийн гинжин хэлхээ нь тааламжгүй байрлалтай байвал дарааллыг тэнцвэргүй ачаалахад хүргэдэг. програмын код (гэхдээ энэ нь практикт бараг хэзээ ч тохиолддоггүй тул гүйцэтгэлд бага нөлөө үзүүлдэг). Үржүүлгийн болон өргөтгөсөн битийн үйлдлүүд нь заасан сувагт орохыг баталгаажуулахын тулд декодчилогчоор зөв гурвалсан үүрэнд байрлуулна.
Тооцооллын сувгийн хуваарьлагчдын дараалалд MOP нь дээр дурдсанчлан санах ойд нэвтрэх бүхэл тоон бичил үйлдэл, хаягийн микро үйлдэлд хуваагддаг. Өгөгдөл бэлэн болмогц хуваарьлагч дараалал бүрээс ALU төхөөрөмж рүү нэг бүхэл тоо, AGU төхөөрөмж рүү нэг хаягийн үйлдлийг эхлүүлэх боломжтой. Санах ойд нэгэн зэрэг нэвтрэх тоо хоёроор хязгаарлагддаг. Тиймээс цагийн мөчлөг бүрт 3 бүхэл тоо, санах ойн 2 үйлдэл (ямар ч хослолоор 64 бит унших/бичих) гүйцэтгэх боломжтой. Төрөл бүрийн арифметик MOP-ийн бичил үйлдлийг дарааллаар нь өгөгдөл бэлэн болмогц дарааллаар нь гүйцэтгэхээр илгээдэг. MOP-ийн арифметик болон хаягийн бичил үйлдлүүд дууссаны дараа MOP-г хуваарийн дарааллаас хасч, дараагийн үйлдлүүдэд орон зайг чөлөөлнө.
K8 процессорын хувьд санах ойн бичил үйлдлийн системүүд нь програм хангамжийн дарааллаар сонгогддог. Програмын дарааллын дарааллаар хийгдсэн санах ойд хандах үйлдлүүд өмнөхөөсөө өмнө ажиллах боломжгүй. Энэ нь дараагийн үйлдлүүдийн бүх операндууд бэлэн байсан ч гэсэн өмнөх хаягийн үйлдлийн хаягийг тооцоолж чадаагүйгээс дараагийн бүх хаягийн үйлдлийг блоклодог.
Жишээлбэл:
ebx, ecx нэмнэ
mov eax, – хаягийн хурдан тооцоолол
mov ecx, – хаяг нь өмнөх командын үр дүнгээс хамаарна
mov edx - өмнөх бүх командын хаягийг тооцоолох хүртэл энэ тушаалыг ажиллуулахгүй.
Энэ нь гүйцэтгэлийн торгуульд хүргэж болзошгүй бөгөөд K8 процессорыг хязгаарлах хүчин зүйлүүдийн нэг бөгөөд үүний улмаас зарим кодууд дээр K8 нь цагийн мөчлөг бүрт хоёр унших зааврыг гаргах чадвартай ч санах ойд нэвтрэх зааврыг нэгээс бага үр ашигтай гүйцэтгэдэг. Цөм 2 процессор нь нэг цагийн мөчлөгт нэг унших командыг ажиллуулдаг боловч өмнөх унших, бичих командуудыг алгасаж унших командуудыг дарааллаар нь гүйцэтгэх механизмтай.
K10 архитектурын процессоруудад энэ саад бэрхшээлийг арилгасан. K10 процессорууд унших болон унших хаягууд хоорондоо зөрчилддөггүй гэдгийг процессор мэдэж байгаа тохиолдолд унших командуудыг дараалалгүй ажиллуулахаас гадна унших командын өмнө бичих командуудыг ажиллуулах боломжтой болсон. Уншихыг алгасаж бичиж эхлэх нь тодорхой төрлийн кодын гүйцэтгэлийг ихээхэн хурдасгах боломжийг олгодог, жишээлбэл, санах ойноос өгөгдлийн дараагийн хэсгийг унших тушаалаар эхэлж, тооцоолсон үр дүнг санах ойд хадгалах замаар дуусдаг циклүүд.
.....// өгөгдөл дээрх үйлдлүүд
mov , eax // үр дүнг хадгалах
cmp
jnz L1
Ийм тохиолдолд бичихээс өмнө уншиж эхлэхийг дэмждэггүй процессор ажиллаж эхлэх боломжгүй дараагийн давталтодоогийн үр дүнг бичих хүртэл давталт. Уншсан дахин эрэмбэлэхийг дэмждэг процессорууд нь одоогийнхыг дуусгахыг хүлээлгүйгээр дараагийн давталтанд өгөгдөл ачаалж, тооцоолох боломжтой.
Харамсалтай нь, K10 процессор нь Core 2 процессоруудын адил үл мэдэгдэх хаяг руу бичих замаар хэрхэн таамаглаж ачаалахаа мэдэхгүй байна.Ийм таамаглал нь торгууль төлөхөд хүргэдэг ч бодит байдал дээр эдгээр торгууль нь програмын кодонд ховор тохиолддог (ойролцоогоор 5). % тохиолдлууд), тиймээс таамаглалын ачаалал нь гүйцэтгэлийн үүднээс зөвтгөгддөг.
K10 процессорын бүхэл тоон блокийн өөр нэг сайжруулалт нь бүхэл тоо хуваах зааврын алгоритмыг оновчтой болгосон явдал юм. Одоо бүхэл тоо хуваах зааврын гүйцэтгэлийн хурд нь ногдол ашиг ба хуваагчийн хамгийн чухал битүүдээс хамаарна. Жишээлбэл, ногдол ашиг нь тэгтэй тэнцүү тохиолдолд хуваах нь бараг хоёр дахин хурдан хийгддэг. Ерөнхийдөө бүхэл тоо хуваах нь маш ховор үйлдэл бөгөөд гүйцэтгэлийн хурд бага тул бодит программ дээр бүх талаар зайлсхийх, хуваагчийн урвуугаар үржүүлэх, шилжүүлэх, өөр аргаар тойрч гарахыг хичээдэг. Тиймээс энэ оновчлол нь програмын гүйцэтгэлд мэдэгдэхүйц хувь нэмэр оруулахгүй байх магадлалтай.
Ерөнхийдөө K10 бүхэл төхөөрөмжийн блок нь маш үр дүнтэй байх болно. Санах ойн үйлдлүүдийг эмх цэгцгүй гүйцэтгэх механизмыг нэмсний дараа энэ нь тодорхой сул талгүй болсон. Хэдийгээр Core 2 процессортой харьцуулахад дарааллын гүн бага боловч K10 процессоруудад регистр файлаас регистрийг уншихад хязгаарлалт байхгүй бөгөөд Core 2-ыг аль болох хурдан үйлдлийг байнга гүйцэтгэхэд саад болдог бусад хуваарийн хязгаарлалтууд байдаггүй.
Бодит зааврыг биелүүлэх
K8 болон K10 процессоруудад хөвөгч цэгийн нэгж (FPU) хуваарь нь бүхэл тооны зааварчилгааны хуваарьчаас тусдаа бөгөөд арай өөрөөр зохион байгуулагдсан. Хуваарилагч буфер нь 3 MOP-ийн 12 бүлгийг (онолын хувьд 36 бодит үйл ажиллагаа) багтааж болно. Тэгш хэмт тооцооллын суваг бүхий бүхэл тоон зааврыг гүйцэтгэх блокоос ялгаатай нь хөвөгч арифметик блок нь гурван зүйлийг агуулна. янз бүрийн төхөөрөмж: Бодит нэмэхэд зориулсан FADD, бодит үржүүлэхэд зориулсан FMUL, санах ой хадгалах заавар болон туслах хөрвүүлэх үйлдлүүдэд зориулагдсан FMISC (FSTORE гэх мэт) тул хуваарийн буфер нь зааврын бүлэг дэх MOP-ийн байрлалыг тодорхой тооцоолох төхөөрөмжтэй холбодоггүй (Зураг 1). 4).
Цагаан будаа. 4. Хөвөгч цэгийн гүйцэтгэлийн нэгж
K8 ба K10 цагийн мөчлөг бүр бодит арифметик төхөөрөмж бүрт нэг үйлдлийг гүйцэтгэх боломжтой. K8 процессорын хөвөгч цэгийн төхөөрөмжүүд нь 80 бит юм. 128 битийн SSE вектор заавар нь код тайлах шатанд хоёр MOP-д хуваагддаг бөгөөд тэдгээр нь 128 битийн операндын 64 битийн тал дээр үйлдлүүдийг гүйцэтгэдэг бөгөөд өөр өөр цагийн мөчлөгөөр дараалан гүйцэтгэгддэг. Энэ нь зөвхөн вектор командын гүйцэтгэлийн хурдыг хязгаарлаад зогсохгүй FPU хуваарийн буферийн үр дүнтэй эзэлхүүнийг бараг хоёр дахин бууруулж, улмаар захиалгат тушаалын гүйцэтгэлийн гүнийг бууруулдаг.
K10 процессорын хувьд FPU төхөөрөмжүүдийн өргөн 128 бит хүртэл нэмэгдсэн. K10 нь 128 битийн вектор операндуудыг бүхэлд нь нэг үйлдлээр боловсруулдаг бөгөөд энэ нь K8-тай харьцуулахад вектор SSE зааврын онолын гүйцэтгэлийн хурдыг хоёр дахин нэмэгдүүлдэг. Нэмж дурдахад, MOP-ийн тоог хоёр дахин бууруулснаар хуваарь гаргагчийн үр дүнтэй дарааллын урт нэмэгдэж, дараалалгүй гүйцэтгэлийг гүнзгийрүүлэх боломжийг олгодог.
K8 процессор дээр SSE ачаалах командуудыг FSTORE төхөөрөмж ашиглан гүйцэтгэдэг бөгөөд энэ нь нэг талаас энэ төхөөрөмжийг шаарддаг бусад тушаалуудыг нэгэн зэрэг гүйцэтгэхийг зөвшөөрдөггүй, нөгөө талаас нэгэн зэрэг эхлүүлсэн ачаалах командын тоог хязгаарладаг. нэг. Хэрэв командуудын аль нэг нь санах ойд хандах хандалт болон өгөгдлийн үйлдлийг (Ачаалах-Гүйцэтгэх команд гэгддэг) хослуулсан заавар байвал K8-ийн санах ойноос хоёр зэрэгцээ уншилтыг хийж болно, жишээлбэл, ADDPS xмм1,.
K10 процессор нь SSE ачаалах командыг гүйцэтгэх механизмд хэд хэдэн чухал сайжруулалт хийсэн.
Нэгдүгээрт, ачаалах командууд нь FPU нөөцийг ашиглахаа больсон тул FSTORE порт бусад командуудыг ажиллуулахын тулд суллагдсан бөгөөд ачаалах командуудыг цагийн мөчлөг бүрт 2 удаа ажиллуулж болно.
Хоёрдугаарт, санах ойн өгөгдөл нь 16 байт хязгаарт зэрэгцсэн тохиолдолд MOVU** өгөгдөл ачаалах зааврууд зэрэгцээгүй MOVA** өгөгдөл ачаалах заавартай адил үр дүнтэй ажилладаг. Тиймээс K10 процессоруудын хувьд MOVA** зааврыг ашиглах нь ямар ч ашиг тусаа өгөхөө больсон.
Гуравдугаарт, K10 процессоруудад ачааллыг өгөгдлийн үйлдэлтэй хослуулсан Ачаалах-Гүйцэтгэх командуудад тэгш бус ачааллыг ашиглахыг зөвшөөрдөг болсон. Ихэвчлэн санах ойд өгөгдөл зэрэгцсэн эсэх нь эргэлзээтэй байвал хөрвүүлэгч (эсвэл программист) MOVU** зааврыг ашиглан өгөгдлийг регистр рүү уншиж, дараа нь регистрүүд дээр үйлдлүүдийг гүйцэтгэдэг. Ачаалах-Гүйцэтгэх командуудыг ашиглан тэгшлээгүй ачааллыг шууд ашиглах нь таны програмын код дахь тусдаа ачаалах командын тоог мэдэгдэхүйц бууруулж, гүйцэтгэлийг сайжруулна. Энэ функцийн дэмжлэгийг хөрвүүлэгчид суулгасан байх ёстой. Ерөнхийдөө SSE тодорхойлолтын дагуу боловсруулсан Intel компани, Load-Execute командыг 16 байт хил дээр зэрэгцүүлээгүй хаяг руу залгахад онцгой тохиолдол гарах ёстой. Техникийн үзүүлэлтийг дагаж мөрдөхийн тулд Ачаалах-Гүйцэтгэх командуудад жигд бус ачааллыг зөвшөөрөхийг шинэ процессорын чадавхийг харгалзан боловсруулж, эмхэтгэсэн программ хангамжаар тусгай тугийг тохируулах замаар идэвхжүүлэх шаардлагатай.
Дөрөвдүгээрт, K10 процессорын эхний түвшний кэшээс өгөгдөл унших хоёр автобусыг 128 бит болгон өргөжүүлсэн. Энэ нь процессорыг цаг тутамд 128 битийн өгөгдлийг хоёр удаа унших боломжийг олгодог. Энэ нь архитектурын маш чухал шинж чанар юм, учир нь хоёр командыг зэрэгцүүлэн гүйцэтгэхэд 4 операнд (нэг заавар бүрт 2) шаардлагатай байдаг ба хэд хэдэн урсгалтай өгөгдөл боловсруулах алгоритмд дөрвөн операндын хоёрыг нь ихэвчлэн RAM-аас уншдаг. Үүний эсрэгээр, K10-ийн хоёр бичих автобус нь 64 битийн хэмжээтэй хэвээр байгаа бөгөөд 128 битийн санах ойн бичилт нь 64 битийн хоёр багцад хуваагддаг. Тиймээс процессор нь цагийн мөчлөг бүрт зөвхөн нэг 128 бит бичих, эсвэл хоёр 128 бит унших, эсвэл нэг 128 бит унших, нэг 64 бит бичих тэсрэлт хийх боломжтой. Гэсэн хэдий ч уншсан тоо нь бичих тооноос дор хаяж хоёр дахин их байдаг тул бичих хязгаар нь 128 битийн өгөгдлийг боловсруулах үед процессорын үр ашигт ихээхэн нөлөөлөх ёсгүй.
Тавдугаарт, 128 битийн MOV*** бүртгэлээс өгөгдөл хуулбарлах зааврыг зөвхөн FADD болон FMUL бус гурван FPU төхөөрөмж дээр гүйцэтгэх боломжтой бөгөөд энэ нь зорилтот үйл ажиллагаанд FADD болон FMUL блокуудыг чөлөөлдөг.
Бидний харж байгаагаар K10 процессорын FPU нэгж нь илүү уян хатан болсон. Ачаалах-Гүйцэтгэх командуудыг багтаасан үр ашигтай, жигдрээгүй ачаалах, цаг тутамд хоёр 128 бит унших зэрэг Intel процессоруудад хараахан байхгүй өвөрмөц онцлогууд байдаг. Core 2-оос ялгаатай нь бодит болон бүхэл тоо төлөвлөгчид тусдаа дарааллыг ашигладаг бөгөөд энэ нь ижил гүйцэтгэлийн портууд дээр зөрчилдөх үйлдлээс зайлсхийхэд тусалдаг. Гэсэн хэдий ч K10 нь SSE дэлгүүрийн үйл ажиллагаанд зориулсан FMISC (FSTORE) төхөөрөмжийг зарим өгөгдөл хувиргах командуудтай хуваалцсан хэвээр байгаа бөгөөд энэ нь зарим тохиолдолд гүйцэтгэлийн хурдад нөлөөлж болзошгүй юм.
Ерөнхийдөө K10 дахь FPU нэгж нь хэд хэдэн параметрийн хувьд Core 2 FPU нэгжийг давж (жишээ нь, нэг цагийн мөчлөгт хоёр 128 бит уншилт хийх, үр ашигтай жигд ачаалал өгөх чадвар) маш үр ашигтай байх болно гэж амлаж байна.
Санах ойн дэд систем
Төхөөрөмжийг ачаалах/хадгалахK8 процессор дээр AGU дээрх санах ойн хандалтын хаягийг тооцоолсны дараа ачаалах, хадгалах ажиллагааг LSU (Ачаалах / Хадгалах Нэгж) - ачаалах / хадгалах төхөөрөмж рүү илгээдэг. LSU нь LS1 ба LS2 гэсэн хоёр дарааллыг агуулдаг. Нэгдүгээрт, ачаалах, хадгалах үйлдлүүд нь LS1 дараалалд ордог бөгөөд энэ нь 12 элементийн гүн юм. LS1 дарааллаас эхний түвшний кэш рүү хандах хандалтыг програм хангамжийн дарааллаар хийдэг бөгөөд нэг мөчлөгт хоёр үйлдэл хийдэг. Кэш алдагдсан тохиолдолд үйлдлүүдийг 32 элементийн гүн LS2 хоёр дахь дараалал руу шилжүүлж, L2 кэш болон RAM-д хандалт хийдэг.
LSU дээр K10 процессорт өөрчлөлт оруулсан. Одоо зөвхөн ачаалах үйлдлүүд LS1 дараалалд очих ба хадгалах үйлдлүүд LS2 дараалал руу илгээгдэнэ. LS1-ээс ачаалах үйлдлийг одоо LS2 дараалалд хадгалах үйлдлүүдийн хаягийг харгалзан дарааллаар нь гүйцэтгэх боломжтой. Дээр дурдсанчлан 128 битийн хадгалах үйлдлүүд нь K10 процессор дээр хоёр 64 бит байдлаар боловсруулагддаг тул LS2 дараалалд хоёр байрлалыг эзэлдэг.
1-р түвшний кэш
K8 болон K10 процессоруудын эхний түвшний кэш нь тусдаа бөгөөд заавар (L1I) болон өгөгдөлд (L1D) тус бүр 64 КБ хэмжээтэй байна. Кэшийн холбоо нь хоёр, мөрийн хэмжээ 64 байт. Холбоо барих чадвар бага нь ижил багцын төлөө өрсөлдөж буй мөрүүдийн хооронд байнга мөргөлдөхөд хүргэдэг бөгөөд энэ нь кэш алдах тоог нэмэгдүүлж, гүйцэтгэлд сөргөөр нөлөөлдөг. Бага нэгдэл нь нэлээд том L1 кэшээр хэсэгчлэн нөхөгддөг. L1D кэшийн том давуу тал нь түүний хос портын чадвар юм - энэ нь цаг тутамд хоёр унших, бичих командыг дурын хослолоор гүйцэтгэх боломжтой.
K10 процессорын хувьд эхний түвшний кэшийн хэмжээ, холбоо нь харамсалтай нь өөрчлөгдөөгүй хэвээр байна. K10-ийн L1 кэшийн цорын ганц мэдэгдэхүйц сайжруулалт нь унших өгөгдлийн автобусны өргөнийг нэмэгдүүлэх явдал байв. Одоо процессор нь өмнөх бүлэгт дурдсанчлан цагийн мөчлөг бүрт 128 битийн хоёр уншилт хийх боломжтой бөгөөд энэ нь SSE өгөгдлийг дотоод санах ойд боловсруулахад түүний үр ашгийг ихээхэн нэмэгдүүлдэг.
2-р түвшний кэш
K8 ба K10 архитектурын хоёр ба дөрвөн цөмт процессоруудад цөм бүр L2 кэштэй байдаг. K10-ийн хоёр дахь түвшний кэшийн хэмжээ нь цөм тус бүр дээр 512 КБ-тай тэнцүү хэвээр байгаа бөгөөд нэгдэл нь 16 байна. Хоёр дахь түвшний кэш нь Core 2 процессорын хоёр дахь түвшний хуваалцсан кэштэй харьцуулахад давуу болон сул талуудтай. Давуу тал нь: хэд хэдэн цөмийн нэгэн зэрэг эрчимтэй ачааллын дор кэш тутамд зөрчилдөөн, өрсөлдөөн байхгүй байх. Сул тал нь нэг ажлыг эрчимтэй гүйцэтгэх үед цөмд ногдох кэшийн хэмжээ бага байдаг.
L2 кэш нь өгөгдөл хадгалах онцгой зохион байгуулалттай: эхний болон хоёрдугаар түвшний кэш дэх өгөгдөл давхарддаггүй. Эхний болон хоёрдугаар түвшний кэш нь нэг чиглэлтэй хоёр автобусаар өгөгдөл солилцдог - нэг нь өгөгдөл хүлээн авах, нөгөө нь илгээх зориулалттай. K8 архитектурын процессорт автобус бүрийн өргөн нь 64 бит (8 байт) байна (Зураг 5а.). Энэ зохион байгуулалттай учраас процессор нь L2-д хүссэн өгөгдлийг цаг тутамд 8 байт бага хурдтайгаар хүлээн авдаг. Өөрөөр хэлбэл, 64 байт мөрийг шилжүүлэхэд 8 цагийн цикл шаардлагатай бөгөөд энэ нь үндсэн өгөгдөл хүлээн авах, ялангуяа хоёр ба түүнээс дээш L2 кэш шугамд нэгэн зэрэг нэвтрэх үед ихээхэн хэмжээний саатлыг нэмэгдүүлдэг.
Бүрэн батлагдаагүй байгаа мэдээллээс үзэхэд K10 процессорын хүлээн авах болон дамжуулах автобусны битийн өргөн 2 дахин, өөрөөр хэлбэл тус бүр нь 128 бит хүртэл нэмэгдсэн байна (Зураг 5б). Энэ нь нэгэн зэрэг хоёр ба түүнээс дээш мөр хүсэх үед кэш хандалтын хоцролтыг мэдэгдэхүйц бууруулах болно.
3-р түвшний кэш
Хоёрдахь түвшний кэшийн хангалтгүй хэмжээг нөхөхийн тулд K10 процессор нь одоо бүх цөмд нийтлэг 2 МБ гурав дахь түвшний L3 кэштэй болсон бөгөөд 32-ын нэгдэлтэй байна. L3 кэш нь дасан зохицох онцгой зохион байгуулалттай: энэ нь хоёр өгөгдлийг хоёуланг нь хадгалдаг. бүх цөмүүдийн L2 кэшээс хасагдсан бөгөөд олон цөмд ашигладаг өгөгдлийг хуваалцсан. Цөмөөс мөрийг унших хүсэлтийг хүлээн авах үед шалгалт хийгдэнэ: хэрэв мөрийг зөвхөн нэг цөм ашиглаж байгаа бол L3-аас хасагдаж, шугамын L2 кэшээс гаргах зайг чөлөөлнө. гол хүсэлт. Хэрэв мөрийг өөр цөм ашиглаж байгаа бол энэ нь кэшэд үлдэх болно; Үүний зэрэгцээ, L2 кэшээс зайлуулж буй шугаманд зай гаргахын тулд өөр хуучин мөрийг L3 кэшээс устгана.
L3 кэш нь цөм хоорондын харилцааны хурдыг нэмэгдүүлэхэд туслах ёстой. Бидний өмнө олж мэдсэнээр орчин үеийн Athlon 64 процессоруудын цөмүүдийн хооронд өгөгдөл солилцох нь санах ойн автобусаар явагддаг. Энэ нь хуваалцсан, өөрчлөх боломжтой өгөгдөлд хандах хурдыг эрс бууруулдаг. AMD-ийн материалуудын дагуу K10 архитектурын дөрвөлсөн цөмт процессоруудад L3 кэшээр дамжуулан цөм хоорондын мэдээлэл солилцох боломжтой. Өөр цөмөөс хүсэлт хүлээн авах үед өөрчилсөн өгөгдлийг хадгалдаг цөм нь үүнийг L3 руу хуулж, тэндээс хүсэлт гаргасан цөм үүнийг унших болно. Өөр цөмийн кэш дэх өөрчлөгдсөн өгөгдөлд хандах хурд мэдэгдэхүйц нэмэгдэх ёстой. Боломж олдвол заавал шалгах болно :).
Цагаан будаа. 6. K10 процессорын цөм хоорондын өгөгдөл дамжуулах
L3 кэшийн хоцролт нь L2 кэшийн хоцрогдолтой харьцуулахад өндөр байх нь ойлгомжтой, гэхдээ AMD-ийн материалууд ачаалалаас хамааран дасан зохицох байдлаар өөрчлөгдөнө гэж хэлдэг - хүнд ачаалал байхгүй тохиолдолд хоцролт нь илүү сайн, ачаалал ихтэй байх болно. хувь хэмжээ нэмэгдэх болно. Үүний цаана яг юу байгааг шалгах л үлдлээ.
TLB
Заавар, өгөгдөлд зориулсан кэш санах ойноос гадна процессорууд өөр төрлийн кэш санах ойтой байдаг - орчуулга-харагдах буфер (TLB). Эдгээр нь хуудасны орчуулгын хүснэгтээс олж авсан виртуал болон физик хуудасны хаягуудын хоорондын захидал харилцааг хадгалахад ашиглагддаг. Орчуулгын буферийн тоо нь нэмэлт үнэтэй хүснэгт хөрвүүлэлтгүйгээр хэдэн санах ойн хуудсыг нэгэн зэрэг ашиглахыг тодорхойлдог. Энэ нь санах ойн өгөгдлийг санамсаргүй дарааллаар боловсруулдаг програмуудад онцгой чухал бөгөөд өгөгдөлд байнгын хандалт байдаг өөр өөр хуудаснууд. K10 процессор нь орчуулгын буферийн тоог ихээхэн нэмэгдүүлсэн. Ойлголтыг хөнгөвчлөхийн тулд тэдгээрийг хүснэгтэд нэгтгэн харуулав.
Хүснэгт 1 – K8 болон K10 процессоруудын TLB хүчин чадал
Хүснэгтээс харахад 2 МБ хуудасны хаягийг хөрвүүлэхэд ашигладаг буферийн тоо мэдэгдэхүйц нэмэгдэж, 1 ГБ хэмжээтэй том хуудасны дэмжлэг гарч ирсэн нь их хэмжээний өгөгдөл боловсруулдаг серверүүдэд ашигтай байх болно. Үйлдлийн системийн дэмжлэгтэйгээр 2-MB болон 1-ГБ хэмжээтэй том хуудас ашигладаг програмууд гүйцэтгэлийн өсөлтөөс ашиг хүртэх болно.
Санах ойн хянагч
Хүссэн өгөгдөл нь бүх түвшний кэшээс олдоогүй тохиолдолд процессорын чип дээр суурилуулсан санах ойн хянагч руу залгана. Процессорын чип дээр хянагчийг нэгтгэх нь санах ойд хандах үеийн хоцролтыг эрс багасгаж, процессорыг тодорхой төрлийн санах ойд холбож, үндсэн талбайг нэмэгдүүлж, чипээс татгалзахтай холбоотой асуудлуудыг нэмэгдүүлдэг. Санах ойн хянагч нь K8 процессоруудын давуу талуудын нэг байсан боловч зарим тохиолдолд хангалттай үр ашиггүй байв. K10 процессорын санах ойн хянагч мэдэгдэхүйц сайжирсан.
Нэгдүгээрт, энэ нь одоо зөвхөн нэг 128 битийн суваг төдийгүй хоёр бие даасан 64 битийн суваг дээр өгөгдөл дамжуулах горимд ажиллах боломжтой бөгөөд энэ нь олон цөмөөр нэгэн зэрэг санах ойд нэвтрэх боломжийг илүү үр дүнтэй болгодог.
Хоёрдугаарт, хянагч дээр үйл ажиллагааны хуваарь гаргах, дахин эрэмбэлэх алгоритмыг оновчтой болгосон. Санах ойн хянагчийн бүлгүүд санах ойн автобусыг хамгийн үр дүнтэй ашиглахын тулд унших, бичих үйлдлүүдийг гүйцэтгэдэг. Унших үйлдлүүд нь бичих үйлдлээс илүү байдаг. Бичихэд зориулагдсан өгөгдлийг буферт хадгалдаг бөгөөд хэмжээ нь одоогоор тодорхойгүй байгаа боловч янз бүрийн эх сурвалжийн мэдээлснээр 16-30 64 байт мөрийн хооронд байдаг. Хэд хэдэн хойшлогдсон шугамын бүлгийг буулгах нь санах ойн автобусыг унших горимоос бичих горимд шилжүүлэх, буцаах зардлыг мэдэгдэхүйц бууруулж чадна. Энэ нь ялангуяа унших, бичих хүсэлтийн урсгалтай ажиллах үед гүйцэтгэлийг сайжруулдаг.
Гуравдугаарт, санах ойн хянагч нь хүсэлтийн дарааллыг шинжилж, урьдчилан татаж авах боломжтой.
Урьдчилан татах
Урьдчилан татах нь K8 процессоруудын хүчтэй тал биш юм. Нэгдсэн бага хоцролттой санах ойн хянагч урт хугацаанд AMD процессоруудад санах ойтой ажиллахдаа сайн гүйцэтгэлийг харуулах боломжийг олгосон. Гэсэн хэдий ч шинэ DDR2 санах ойтой ажиллахдаа K8 процессорууд нь хүчирхэг урьдчилан татах системтэй Core 2 процессоруудаас ялгаатай нь өндөр үр ашигтай байсангүй. K8 процессорууд нь хоёр урьдчилан татах төхөөрөмжтэй байдаг - нэг нь код, нөгөө нь өгөгдөл юм. Мэдээллийг урьдчилан татах төхөөрөмж нь хялбаршуулсан дарааллыг ашиглан хоёрдугаар түвшний кэш рүү урьдчилан татаж авах ажиллагааг гүйцэтгэдэг.
K10-д урьдчилан таталт сайжирсан.
Нэгдүгээрт, K10 нь L1 кэш рүү шууд урьдчилан татдаг бөгөөд энэ нь өгөгдөлд хандах үед L2 кэшийн хоцролтыг нуух боломжийг олгодог. Хэдийгээр энэ нь L1 кэш нь шаардлагагүй мэдээллээр бөглөрөх магадлалыг нэмэгдүүлдэг, ялангуяа кэш багатай холбоотой боловч AMD-ийн үзэж байгаагаар энэ нь үр дүнгээ өгч, гүйцэтгэлийг сайжруулдаг.
Хоёрдугаарт, дасан зохицох урьдчилан татах механизмыг хэрэгжүүлсэн бөгөөд энэ нь өгөгдөл цаг тухайд нь ирж, кэшийг хараахан шаардлагагүй өгөгдлөөр бөглөхгүй байхын тулд урьдчилан татах зайг динамикаар өөрчилдөг. Урьдчилан ачаалах нэгжийн уян хатан байдал нэмэгдсэн: энэ нь одоо зөвхөн зэргэлдээх мөрөнд байрлах хаягууд дээр биш, дурын хаяг дахь санах ойн хүсэлтээс суралцах боломжтой болсон. Нэмж хэлэхэд, prefetch блок нь одоо програм хангамжийн урьдчилан татах зааврыг хүндэтгэдэг.
Гуравдугаарт, санах ойн хянагч дээр тусдаа урьдчилан ачаалах нэгжийг шууд нэмсэн. Санах ойн хянагч нь цөмөөс ирсэн хүсэлтүүдийн дарааллыг шинжилж, өгөгдлийг бичих буфер руу ачаалж, санах ойн автобусыг оновчтой ашигладаг. Урьдчилан дуудах мөрүүдийг бичих буферт хадгалах нь кэш санах ойг бөглөрөхөөс зайлсхийхийн зэрэгцээ өгөгдөлд нэвтрэх хоцролтыг эрс багасгах боломжийг олгоно.
Үүний үр дүнд K10 процессоруудын санах ойн дэд системд өөрчлөлт орсон болохыг бид харж байна илүү сайн тал. Гэхдээ хэд хэдэн шинж чанараараа энэ нь Intel процессоруудын санах ойн дэд системээс доогуур байж болохыг тэмдэглэх нь зүйтэй. Энэ нь хараахан тодорхойгүй хаяг руу бичихийг тойрч гарах таамаглалын ачаалал байхгүй, L1D кэшийн холбоо бага, L1 ба L2 кэшийн хооронд нарийссан (өгөгдлийн дамжуулалтын хурдны хувьд) автобус, L2 хэмжээ бага, урьдчилан татаж авах нь илүү хялбар байдаг. Сайжруулсан хэдий ч Core 2-ийн урьдчилан татах чадвар нь K10-аас илүү хүчтэй байж болох юм: жишээлбэл, сүүлийнх нь зааврын үйлдлийг хянах заавар-хаяг урьдчилан татах, түүнчлэн L2-ийн хоцролтыг үр дүнтэй далдлахын тулд L2-оос L1 хүртэл урьдчилан татах боломжгүй. Эдгээр хүчин зүйлүүд нь өөр өөр програмуудад өөр өөрөөр нөлөөлж болох ч зарим тохиолдолд Intel процессоруудын гүйцэтгэлийг сайжруулахад хүргэдэг.
K10 архитектур бидэнд өөр ямар шинэлэг зүйлийг авчирдаг талаар товчхон харцгаая.
Шинэ багууд
K10 процессор нь одоо түүний чадавхийг өргөжүүлэх хэд хэдэн шинэ командыг дэмждэг.
1. Ерөнхий зориулалтын регистр дээр өргөтгөсөн битийн үйлдлүүдийн командууд:
LZCNT – Count Leading Zeros – операнд дахь эхний тэг битийн тоог тоолно;
POPCNT – Битийн популяцийн тоо – операнд дахь нэг битийн тоог тоолно.
2. SSE4a гэж нэрлэгддэг SSE бүртгэл боловсруулах заавар:
EXTRQ – SSE регистрийн доод 64 битийн хэсэгт заасан байрлалаас тодорхой тооны битүүдийг гаргаж авдаг;
INSERTQ – SSE регистрийн доод 64 битийн хэсэгт заасан байрлалд заасан тооны битүүдийг оруулна;
MOVNTSS, MOVNTSD – скаляр бодит утгыг хадгалах (кэш санах ой ашиглахгүйгээр) дамжуулах командууд.
SSE4a гэж нэрлэгддэг зааврын багц өргөтгөл нь бие даасан бөгөөд SSE4.1 болон SSE4.2 гэж нэрлэгддэг Intel-ийн шинэ өргөтгөлүүдтэй ямар ч байдлаар давхцдаггүй.
Виртуалчлал
AMD нь хэд хэдэн удаа ажиллуулахад ашигладаг виртуалчлалын технологийг үргэлжлүүлэн сайжруулсаар байна үйлдлийн системүүднэг компьютер дээр. Виртуалчлалын хамгийн чухал сайжруулалтын нэг нь үүрлэсэн хуудасны хүснэгтүүдийг (Nested Paging) ашиглах явдал байв. Энэ горимд виртуал машины хуудасны хүснэгтүүд нь дэлхийн гипервизорын хуудасны хүснэгт дотор байрладаг. TLB-д хуудасны лавлагаа байхгүй тохиолдолд Shadow Paging-ээс ялгаатай нь хүснэгтийг хөрвүүлэх үйлдлийг процессор автоматаар гүйцэтгэдэг. их хэмжээнийвиртуал машины хүснэгтийн зураглалыг удирдах нөөц.
Зарим мэдээллээр, үүрлэсэн хуудасны хүснэгтүүдийг ашигласны ачаар програмын хурд хүртэл байна виртуал машин"сүүдэр" хуудасны хүснэгтүүдийг ашиглах үед эдгээр програмуудын гүйцэтгэлийн хурдтай харьцуулахад 40% хүртэл нэмэгддэг.
Эрчим хүч ба давтамжийн удирдлага
Шинэ K10 процессорууд нь эрчим хүчний менежмент болон үндсэн давтамжийн удирдлагын шинэ схемийг нэвтрүүлж байна. Цөм тус бүр өөрийн давтамжтайгаар бусдаас үл хамааран ажиллах боломжтой бөгөөд энэ нь цөм бүрийн ачааллаас хамааран динамикаар өөрчлөгддөг.
Цагаан будаа. 8. Бие даасан давтамжийн хяналт
K10 процессор дахь цөм
Үүний зэрэгцээ бүх цөмд нийтлэг байдаг L3 кэшийн ажиллах давтамжийг хэрхэн зохицуулах нь тодорхойгүй хэвээр байна. Бүх судал дээрх хүчдэл нь ижил бөгөөд хамгийн их ачаалалтай цөмөөр тодорхойлогддог. Санах ойн хянагч нь хүчдэлээ цөмөөс хамааралгүйгээр хянадаг бөгөөд хүнд ачаалал байхгүй үед үүнийг бууруулж чаддаг.
дүгнэлт
Шинэ AMD процессоруудын талаарх бүх мэдээлэл хараахан хэвлэгдээгүй байгаа тул гэнэтийн зүйл биднийг хүлээж магадгүй юм. Гэсэн хэдий ч бичил архитектурын үндсэн дүгнэлтийг аль хэдийн гаргаж болно. Шинэ AMD процессор нь олон тооны үндсэн сайжруулалтуудын ачаар өмнөх хувилбараасаа, ялангуяа бодит цагийн эрчимтэй хэрэглээнд гүйцэтгэлийн хувьд мэдэгдэхүйц үсрэлт амлаж байна. Өргөн хүрээний хэрэглээний хувьд процессор нь нэг давтамжтай ижил нөхцөлөөр өрсөлдөх боломжтой болно Intel процессоруудмөн тэднийг ял. Шинэ зүйлийг харгалзан бичсэн өргөдөл өвөрмөц боломжуудүр ашигтай жигд ачаалах, 1ГБ хэмжээтэй том хуудсыг дэмжих зэрэг процессор. Гэсэн хэдий ч процессор нь Intel процессортой харьцуулахад сул талуудтай байдаг - эдгээр нь кэш хийх, урьдчилан татах дэд системүүд бөгөөд энэ нь хэд хэдэн програмын гүйцэтгэлд сөргөөр нөлөөлдөг. Гэхдээ эхний шатанд дээд амжилтын төлөөх тэмцлийн хамгийн том дутагдал нь хангалтгүй байх магадлалтай өндөр давтамжтай. AMD-д шинэ давтамжуудыг хурдан хөгжүүлэхийг хүсэн ерөөж, хэрэглэгчдийн төлөөх тэмцэлд хоёр компани хэрхэн тэмцэж, процессоруудаа улам сайжруулж байгааг үргэлжлүүлэн харцгаая.Зохиогч нийтлэлийг бэлтгэхэд тусалсан Мария Малич, Сергей Романов ака Грей нарт талархал илэрхийлж байна..
Socket AM3-тай процессорууд 2013 оны хоёрдугаар улирал хүртэл зах зээл дээр байх болно
AMD-ийн төсвийн APU загваруудын үнийн бууралт
AMD нь тааламжтай гэнэтийн бэлэг байлаа хямд үнэ AMD A (Trinity) шугамын хоёр дахь үеийн APU-д зориулагдсан. Мөн ойрын ирээдүйд үнийн бодлогоо дахин баярлуулж, төсвийн АПУ-ын зардлыг мэдэгдэхүйц бууруулахаар төлөвлөж байна.
Хэрэв өмнөх үеийн загваруудын (AMD A4-3300 ба A4-3400) үнийг 46 ба 48 доллараас 30 ба 35 доллар болгон бууруулах нь нэлээд хүлээгдэж буй шийдвэр мэт харагдаж байвал (үлдсэн хувьцаагаа зарахын тулд), дараа нь бууруулах Шинэ AMD A4 эрлийз процессор 5300-ийн үнэ 53 доллараас 30 долларын хооронд хэлбэлзэж байгаа нь үнэхээр санаанд оромгүй, тааламжтай алхам юм.
Дээр дурдсан APU-ийн өртөг буурсан тухай мэдээлэл Тайваний эх хавтангийн үйлдвэрлэгчидтэй ойр эх сурвалжаас ирсэн тул шинэ үнийг албан ёсоор нэвтрүүлэх огноо тодорхойгүй хэвээр байгааг анхаарна уу. Ойрын ирээдүйд үнэ нь буурах AMD APU-ийн техникийн үзүүлэлтүүдийн хүснэгт дараах байдалтай байна.
"Мартагдсан" анхдагч түвшний процессорууд AMD Sempron X2 198 болон AMD Athlon II X2 221
Өнгөрсөн оны дундуур AMD өргөжсөн бүрэлдэхүүнХоёр шинэ анхан шатны түвшний процессор: AMD Sempron X2 198 AMD Lynx платформд зориулж бүтээгдсэн бөгөөд Socket FM1 холбогчийг дэмждэг. Гэсэн хэдий ч ялгаатай бусад ижил төстэй загварууд, эдгээр шинэ зүйлс хэзээ ч олноор худалдаалагдаж эсвэл OEM системийн зах зээлд гараагүй.
Мэдэгдэж байгаагаар загвар өмсөгчид AMD Sempron X2 198Гэсэн хэдий ч зөвхөн Хятадын зах зээлд, дараа нь Европын зах зээлд зориулагдсан бэлэн ширээний компьютеруудын нэг хэсэг болгон худалдаанд гарсан бөгөөд энэ оны эхний хагаст танилцуулагдсан.
шийдлүүд гэдгийг анхаарна уу AMD Sempron X2 198мөн хоёр процессорын цөмөөр тоноглогдсон бөгөөд нэрлэсэн давтамж нь 2.5 ба 2.8 ГГц, DDR3-1600 МГц стандартын хоёр сувгийн RAM хянагч, интерфэйс хянагч. PCI Express 2.0. Хоёр шинэ бүтээгдэхүүний TDP нь 65 Вт байна. Дэлгэрэнгүй харьцуулах хүснэгтпроцессорын техникийн үзүүлэлтүүд AMD Sempron X2 198Мөн:
AMD Sempron X2 198 |
|||
Ширээний системүүд |
|||
Бичил архитектур |
|||
Платформ |
|||
CPU залгуур |
|||
Үйлдвэрлэлийн стандарт, nm |
|||
Физик цөмийн тоо |
|||
L1 кэшийн хэмжээ, КБ |
Зааварчилгаа |
||
L2 кэшийн хэмжээ, КБ |
|||
Нэгдсэн хянагч |
Хос сувгийн DDR3 санах ой, PCI Express 2.0 интерфейс |
||
Дэмжигдсэн санах ойн модулиуд |
|||
Дулааны багц (TDP), В |
|||
MMX, 3DNow!, SSE, SSE2, SSE3, SSE4a, Advanced Bit Manipulation, AMD64, Виртуалчлал, Сайжруулсан вирусын хамгаалалт, PowerNow! |
Шинэ хос AMD A4-3450 болон AMD A4-4300M эрлийз процессор
Хоёр шинэ эрлийз процессор бэлтгэх тухай мэдээлэл гарсан - AMD A4-3450Тэгээд. Тэдний эхнийх нь ширээний шийдлүүдийн ангилалд багтдаг. Энэ нь AMD K10 бичил архитектур дээр суурилсан бөгөөд AMD Llano гэгддэг APU-ийн эхний үеийнх юм. Загварын зүрхэнд AMD A4-3450график цөм болох 2.8 GHz давтамжтай хоёр процессорын цөм байдаг AMD Radeon HD 6410 ба хос сувгийн RAM хянагч стандарт DDR3-1600. Шинэ бүтээгдэхүүний TDP нь 65 Вт бөгөөд энэ нь бөөнөөр худалдаанд гарахгүй, зөвхөн бүрэн тоноглогдсон ширээний компьютерт л гарах болно.
APU нь төсвийн гар утасны шийдлүүдийн ангилалд багтдаг бөгөөд хоёр дахь үеийн эрлийз процессоруудад (AMD Trinity) хамаардаг. Энэхүү шинэ бүтээгдэхүүн нь нэрлэсэн давтамж нь 2.5 ГГц, динамик нь 3.0 ГГц хүрэх боломжтой хоёр процессорын цөм, AMD Radeon HD 7420G график цөм, хоёр суваг DDR3 RAM хянагчаас бүрдэнэ.
Шинэ эрлийз процессоруудын техникийн үзүүлэлтүүдийн нарийвчилсан харьцуулалтын хүснэгт AMD A4-3450мөн иймэрхүү харагдаж байна:
Төсвийн хоёр цөмт AMD Sempron X2 190 процессор нь 49.87 долларын үнэтэй.
Шинэ төсөвт процессор Японд жижиглэн худалдаанд гарлаа. Энэ нь AMD Regor хоёр процессорын цөм, Socket AM3-ийн дэмжлэгийг ашиглан 45нм AMD K10 бичил архитектур дээр суурилдаг.
Загварын нэрлэсэн давтамж нь 2.5 GHz юм. Энэ нь нэгдсэн график цөмийг дэмждэггүй боловч хос сувгийн RAM стандарт DDR3-1066 MHz-д зориулсан суурилуулсан хянагчтай гэдгийг анхаарна уу. Шинэ бүтээгдэхүүний дулааны багц нь 45 Вт дотор байна.
Японы зах зээл дээрх энэхүү шийдлийн тооцоолсон үнэ 49.87 ам.доллар байна. Шинэ процессорын техникийн үзүүлэлтүүдийн хураангуй хүснэгт:
Зах зээлийн сегмент |
Ширээний системүүд |
|
Бичил архитектур |
||
Цөмийн кодын нэр |
||
CPU залгуур |
||
Физик цөмийн тоо |
||
Нэрлэсэн цагийн давтамж, МГц |
||
L1 кэшийн хэмжээ, КБ |
Зааварчилгаа |
|
L2 кэшийн хэмжээ, КБ |
||
Нэгдсэн хянагч |
Хос сувгийн DDR3 санах ой |
|
Дэмжигдсэн модулиуд |
||
TDP үзүүлэлт, В |
||
Ойролцоогоор үнэ |
AMD A4-3420 APU нь хүн бүрт боломжтой болно
AMD нь өөрийн ширээний APU-ийн Box хувилбарыг зах зээлд гаргахаар бэлтгэж байна AMD A4-3420. Сануулахад, энэ оны нэгдүгээр сараас энэ шийдвэр OEM компаниуд бүрэн системийг бүтээхэд амжилттай ашигладаг.
Загвар AMD A4-3420 AMD "Lynx" платформд зориулсан 32 нм AMD K10 микро архитектурын үндсэн дээр бүтээгдсэн бөгөөд дараахь зүйлийг дэмждэг.
2.8 GHz нэрлэсэн давтамжтай хоёр процессорын цөм;
AMD Radeon HD 6410D график цөм, 600 МГц давтамжтай;
1 MB L2 кэш;
DDR3-1600 МГц модулиудыг дэмждэг хоёр сувгийн санах ойн хянагч.
Шинэ бүтээгдэхүүний дулааны багц нь 65 Вт багтаамжтай бөгөөд загвар нь 65 долларын үнээр худалдаанд гарах болно. Мэдээллийн хуудас APU AMD A4-3420
Загвар |
AMD A4-3420 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Зах зээлийн сегмент |
Ширээний компьютер |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Платформ |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Бичил архитектур |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Үйлдвэрлэлийн процессын стандартууд, nm |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
CPU залгуур |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Физик цөмийн тоо |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Нэрлэсэн цагийн давтамж, GHz |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
L1 кэшийн хэмжээ, КБ |
Зааварчилгаа |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
L2 кэшийн хэмжээ, КБ |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Нэгдсэн хянагч |
Хос сувгийн DDR3 санах ой, график цөм, PCI Express 2.0 интерфейс |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Брэндийн нэр |
AMD Radeon HD 6410D |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Цагийн давтамж, МГц |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Дэмжигдсэн RAM модулиуд |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Дулааны багц, В |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Дэмждэг заавар, технологи |
MMX, 3DNow!, SSE, SSE2, SSE3, SSE4a, AMD64, AMD-V (виртуалчлал), Сайжруулсан вирусын хамгаалалт, PowerNow! |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ойролцоогоор үнэ, доллар |
Тодорхой процессор болон APU-д зориулсан AMD-н үнийн бодлогод гарсан өөрчлөлтAMD компани зарим процессорууд болон APU-нхаа үнийг өөрчлөхөөр шийджээ. Ялангуяа санал болгож буй зардал зургаан цөмт процессор AMD FX-6100доллараар буурч, 155 ам.долларт хүрсэн байна. Гурван цөмт APU-ийн үнийг мөн 89 доллараас 85 доллар болгон бууруулсан. Зарим АПУ-ын үнэ нэмэгдсэнийг анхаарна уу. Энэ нь ширээний хоёр шийдэлд хамаарна - AMD A4-3300 ба A4-3400. Тэдний үнэ 2 доллараар нэмэгдэж, 66 болон 71 долларт хүрсэн байна. Дээр дурдсан процессор болон APU-ийн техникийн үзүүлэлтүүдийн хураангуй хүснэгт дараах байдалтай байна. Шинэ AMD Athlon II X4 651 процессорын албан ёсны мэдэгдэлШинэ ширээний процессорыг танилцууллаа. Өмнөх үеийнхээ нэгэн адил () нь AMD FM1 холбогчдод зориулсан AMD Lynx платформд багтдаг. Энэхүү загвар нь 3.0 GHz давтамжтай дөрвөн процессорын цөм, PCI Express 2.0 интерфэйс хянагчтай. AMD Lynx платформын нэг хэсэг болох AMD A line APU-ээс ялгаатай нь шинэ бүтээгдэхүүн нь график цөмөөр тоноглогдоогүй. Уусмалын дулааны багц нь 100 Вт-ын түвшинд байна. 1000 ширхэгтэй шинэ бүтээгдэхүүний санал болгож буй үнэ нь $92 бөгөөд удахгүй худалдаанд гарах болно. Шинэ процессорын техникийн үзүүлэлтүүдийн хүснэгт дараах байдалтай байна.
|
Дараагийн үеийн бичил архитектурын тухай анх 2003 онд форум дээр гарч ирэв Микропроцессорын форум 2003. Шинэ бичил архитектурт 10 ГГц хүртэлх цагийн хурдтай ажиллах олон цөмт процессорууд орно гэж тэмдэглэв. Дараа нь цагийн давтамжийг хэд хэдэн удаа багасгасан. 2009 он хүртэлх хугацаанд нийтлэгдсэн стратегийн төлөвлөгөөнд 5-р сард AMD-ийн дөрвөлсөн цөмт процессоруудыг хөгжүүлэх тухай албан ёсны анхны дурдагдсан байдаг.
Үнэн бол тэр үед шинэ бичил архитектурыг AMD K8L код нэрээр жагсаасан бөгөөд зөвхөн 2007 оны 2-р сард AMD K10 эцсийн нэрийг баталсан.
Сайжруулсан AMD K8 архитектурт суурилсан процессорууд нь анхны дөрвөлсөн цөмт AMD процессорууд болохоос гадна зах зээл дээрх бүх 4 цөм нь нэг чип дээр байрладаг анхны процессорууд байх ёстой байв (өмнө нь 4 цөм нь нэг чип дээр байрладаг. хоёр цөмт Opteron талстууд болох дөрвөн цөмт AMD процессор).
Архитектурын онцлог
AMD K8 дээр суурилсан K10 үеийн процессорууд болон тэдгээрийн өмнөх үеийн процессоруудын гол ялгаа нь нэг чип дээрх дөрвөн цөм, Hyper-Transport протоколын 3.0 хувилбарт шинэчлэлтүүд, бүх цөмд зориулсан нийтлэг L3 кэш, түүнчлэн ирээдүйтэй дэмжлэг юм. DDR3 санах ойн хянагч. Цөмүүд нь мөн AMD-н K8 цөмүүдээс шинэчлэгдсэн.
Шууд холболтын архитектур
- Санах ойн хянагч болон оролт гаралтын сувгийг цөмд шууд холбох замаар гүйцэтгэл, үр ашгийг нэмэгдүүлэх боломжийг танд олгоно.
- 32 болон 64 битийн тооцооллыг нэгэн зэрэг гүйцэтгэх зориулалттай.
- DDR2 санах ойн хянагчийг нэгтгэх (533 (1066) МГц хүртэл горим, түүнчлэн DDR3-ийн ирээдүйн дэмжлэг)
Давуу тал:
- Санах ойн хандалтын хоцролтыг багасгах замаар програмын гүйцэтгэлийг нэмэгдүүлнэ
- Хүсэлт дээр үндэслэн санах ойн зурвасын өргөнийг хуваарилдаг
- Hyper-Transport технологи нь хоцролтоос урьдчилан сэргийлэхийн тулд холболтыг 16.0 ГБ/сек хүртэл дээд хурдаар хангадаг.
- Нийт 33.1 ГБ/сек хүртэл зурвасын өргөнпроцессор ба системийн хооронд (Hyper-Transport автобус болон санах ойн хянагч орно)
AMD тэнцвэртэй ухаалаг кэш
Нэг цөмд 512KB L2 кэшээс гадна 2MB L3 кэшийг бүх цөмд хуваалцдаг. Үр ашиг нь гүйцэтгэлийг сайжруулахын тулд байнга ашиглагддаг өгөгдөлд хандах үед хоцролтыг багасгадаг.
AMD өргөн хөвөгч цэгийн хурдасгуур
Нэг цөмд 128 битийн FPU. Давуу тал нь хөвөгч цэгийн тооцоололд өгөгдлийг хурдан түүвэрлэх, боловсруулах явдал юм.
HyperTransport
- 4000 MT/s хурдтай 16 битийн нэг суваг
- Hyper-Transport 3.0 горимд ажиллах үед 8.0 ГБ/с, 16.0 ГБ/с хүртэл дээд хурдтай Hyper-Transport холболт
- Процессор ба системийн хоорондох нийт зурвасын өргөн 33.1 ГБ/сек хүртэл (Hyper-Transport автобус болон санах ойн хянагч орно)
Нэгдсэн санах ойн хянагч
Давуу тал - хурдан нэвтрэхгүйцэтгэлийг нэмэгдүүлэхийн тулд системийн нөөцөд .
AMD-V
Одоогийн болон ирээдүйн виртуалчлалын орчинд гүйцэтгэл, найдвартай байдал, аюулгүй байдлыг сайжруулахад зориулагдсан техник хангамжид суурилсан функцүүдийн багц. виртуал машинуудхуваарилагдсан санах ойд шууд хандах
Cool'n'Quiet 2.0
- Процессорын ажиллагааг ачааллаас хамааран автоматаар тохируулдаг эрчим хүчний удирдлагын дэвшилтэт систем
- Сул зогсолтын үед цахилгаан зарцуулалт багасч, эргэлтийн хурд багасна
CoolCore
- Процессорын ашиглагдаагүй хэсгүүдийг унтрааснаар эрчим хүчний хэрэглээг багасгах боломжийг танд олгоно.
- Санах ойн хянагч болон процессорын логикийн тусдаа систем нь бие биенээсээ хамааралгүйгээр хүчдэлийг хянах, унтраах боломжийг олгодог
- Драйвер болон BIOS-ийн дэмжлэг шаардлагагүйгээр автоматаар ажиллана
- Цөм бүрийн давтамжийг бие даан хянах боломжийг олгодог
- Үйлдлийн горимыг солих хурд нь процессорын цөмийн нэг мөчлөгтэй тэнцүү байна
TLB алдаа
Үзүүлэлтүүд
- Процессын технологи: 65нм SOI
- үндсэн талбай: 283 мм²
- транзисторын тоо: 450 сая
- хүчдэл: 1.05-1.38V
- Сокет: AM2+ (940 зүү) / Сокет F (1207 зүү)
Сонголтууд
Ширээний компьютерт зориулсан
Ширээний системд зориулсан Phenom процессор, мөн Socket AM2+ залгуурт зориулсан Opteron 13xx цуврал. Phenom цувралын бүх процессорууд нь Socket AM2-тэй хоцрогдсон нийцтэй Socket AM2+ дээр бүтээгдсэн. Socket AM2-г дэмждэг эх хавтан дээр Phenom процессоруудыг ашиглахдаа Hyper-Transport 3.0 автобусны дэмжлэг, санах ойн хянагч (хойд гүүр), L3 кэш болон цөмүүдийн тусдаа цаг, мөн эрчим хүч хэмнэх зарим функцүүд алга болдог.
Серверүүдийн хувьд
Серверүүдэд зориулсан Opteron 83xx болон 23xx цувралууд.
Opteron цуврал процессорууд нь Socket F дээр суурилсан хуучин эх хавтан дээр ажиллах боломжтой болно. Аль ч тохиолдолд та зөвхөн BIOS-ийг шинэчлэх хэрэгтэй эх хавтан. Эдгээр бүх процессорууд нь AMD64 архитектур дээр суурилагдсан бөгөөд 32 битийн x86, 16 бит, AMD64 кодтой ажиллах чадвартай.
K10-ийн анхны цөм нь серверт зориулагдсан процессоруудад зориулагдсан "Барселона" гэсэн кодтой. Хожим нь ширээний компьютерт зориулсан процессорууд гарсан бөгөөд K10 цөмийг "Agena" гэж нэрлэжээ.
K10 цөмтэй процессорууд
AMD-ийн төрөл зүйлд K10 үеийн процессорууд гарч ирснээр тэдгээрийн тэмдэглэгээ бас өөрчлөгдсөн - K10 ба AMD K8 дээр суурилсан загвар хоёулаа шинэ нэрийн дор нуугдаж байна.
Процессорын цуврал | Зориулалт |
---|---|
Phenom X4 дөрвөн цөмт ( Агена) | X4 9хх0 |
Phenom X3 гурван цөмт ( Толиман) | X3 8хх0 |
Athlon хоёр цөмт ( Кума) | 7хх0 |
Атлон нэг цөмт ( Лима) | 1хх0 |
Sempron нэг цөмт ( Спарта) | 1хх0 |
Барселона гол
- AMD Opteron 3G 8350, 4 цөм, 2.0 GHz, 75 Вт
- AMD Opteron 3G 8347, 4 цөм, 1.9 GHz, 75 Вт
- AMD Opteron 3G 2350, 4 цөм, 2.0 GHz, 75 Вт
- AMD Opteron 3G 2347, 4 цөм, 1.9 GHz, 75 Вт
- AMD Opteron 3G 8356, 4 цөм, 2.3 GHz, 75 Вт
- AMD Opteron 3G 8354, 4 цөм, 2.2 GHz, 75 Вт
- AMD Opteron 3G 2356, 4 цөм, 2.3 GHz, 75 Вт
- AMD Opteron 3G 2354, 4 цөм, 2.2 GHz, 75 Вт
- AMD Opteron 3G 2352, 4 цөм, 2.1 GHz, 75 Вт
- AMD Opteron 3G 1356, 4 цөм, 2.3 GHz, 75 Вт
- AMD Opteron 3G 1354, 4 цөм, 2.2 GHz, 75 Вт
- AMD Opteron 3G 1352, 4 цөм, 2.1 GHz, 75 Вт
- AMD Opteron 3G 8347 HE, 4 цөм, 1.9 GHz, 55 Вт
- AMD Opteron 3G 8346 HE, 4 цөм, 1.8 GHz, 55 Вт
- AMD Opteron 3G 2347 HE, 4 цөм, 1.9 GHz, 55 Вт
- AMD Opteron 3G 2346 HE, 4 цөм, 1.8 GHz, 55 Вт
- AMD Opteron 3G 2344 HE, 4 цөм, 1.7 GHz, 55 Вт
- AMD Opteron 3G 8360 SE, 4 цөм, 2.5 GHz, 95 Вт
- AMD Opteron 3G 8358 SE, 4 цөм, 2.4 GHz, 95 Вт
- AMD Opteron 3G 2360 SE, 4 цөм, 2.5 GHz, 95 Вт
- AMD Opteron 3G 2358 SE, 4 цөм, 2.4 GHz, 95 Вт