Con el nombre en clave de Nehalem
conocido hasta ahora desde hace varios años que se lleva desarrollando,
por fin llega al mercado rebautizado con el nombre comercial Intel Core
i7 en sus versiones de dos, cuatro y ocho núcleos.
Construído a 45 nm., es el primer
procesador del Intel en conseguir poner cuatro y ocho procesadores
integrados de forma nativa compartiendo una misma memoria caché y
procesador de instrucciones. Asímismo vuelve la tecnología
hyperthreading ya utlizada en el Pentium 4, por lo el sistema operativo
nos reportaría 16 procesadores si tuvierámos instalado el Intel Core i7
Octo. Además el controlador de memoria va integrado dentro del propio
procesador con la nueva tecnología QuickPath, algo a lo que AMD ya nos
tiene acostumbrados desde hace bastante tiempo con su tecnología
HyperTransport.
Tenemos cambio de socket y de chipsets,
es decir, este procesador no será compatible con ninguna de las placas
madres desarrolladas para Intel Core 2 y procesadores anteriores. Intel
Core i7 necesita placas madre nuevas y chipsets nuevo. El zócalo para
el procesador ha crecido considerablemente de tamaño pasando a ser
LGA1366 en comparación con el anterior LGA775.
El Nombre “Intel Core i7″
Aunque Intel aún no se han pronunciado
acerca de la procedencia del nombre “i7″, se ha especulado mucho sobre
este nombre en la web. No coincido con ninguna de estas especulaciones,
por lo que publico aquí la mía. La letra “i” vendría de Intel, y el
número haría referencia a la generación del procesador según la
siguiente tabla.
Generación 1: Abarcaría todos los procesadores de Intel hasta el 80188.
Generación 2: El procesador Intel 286 y todas sus variantes.
Generación 3: El procesador Intel 386 y todas sus variantes.
Generación 4: El procesador Intel 486 y todas su variantes.
Generación 5: El procesador Intel Pentium y todas sus variantes.
Generación 6: El procesador Intel Core, Intel Core 2 y todas sus variantes.
Generación 7: El procesador Intel Core i7.
Múltiples Núcleos con HyperThreading (HT) Multi-Threading (SMT).
Una de las principales características de este procesador es el integrar múltiples núcleos de forma nativa (single die).
Es decir, núcleos que comparten la memoria caché y el juego de
instrucciones. Disponible en versiones de dos, cuatro y ocho núcleos a
velocidades que van inicialmente desde los 2.66 Ghz. hasta por encima
de los 4 Ghz, aunque inicialmente solo veremos las versiones de cuatro
núcleos.
Con Hyperthreading
Multi-Threading, tecnología ya utilizada con Pentium 4, cada procesador
será capaz de ejecutar dos instrucciones por cada ciclo de reloj, por
lo que en un sistema que tenga instalado el Intel Core i7 con cuatro
núcleos, el sistema operativo le reportará que tiene instalado ocho
núcleos.
El viejo HyperThreading (HT), cambia de nombre con Intel Core
i7, para llamarse Simultaneous Multi-Threading (SMT) contará con 2 vías
(2-way) que permitirá administrar hasta 16 hilos (threads) de ejecución
en un procesador de ocho cores, que es lo que permite Intel Core i7
o en su defecto 8 hilos de ejecución en un procesador Quad core.
Resulta algo contradictorio pues los procesadores multi-núcleos
deberían suplir lo que se intentaba hacer con el HyperThreading en
procesadores de un solo núcleo de la compañía años atrás, pero la idea
de tener mas hilos de ejecución es algo que para futuros sistemas de
computo seduce bastante y si se pueden entre comillas tener mas hilos,
habrá que ver como los sistemas y aplicaciones aprovechan estos canales
adicionales para optimizar la performance, pues es sabido que cuando
Intel incorporo el HT en sus P4, no todas las aplicaciones hacían uso o
sabían aprovecharlo, pues todo o casi todo se programaba para un solo
hilo de ejecución. Actualmente la tendencia es aprovechar los
procesadores dual o quad core para optimizar el rendimiento, veremos si
este remozado HT logra hacer diferencia.
Memoria Caché Compartida de Alto-Nivel.
Mejoras en la memoria caché con una
nueva arqitectura de tres niveles: la caché L1 con 32 Kb. de caché para
intrucciones y otros 32 Kb para caché de datos; nueva caché L2 por
núcleo de latencia muy baja con 256 Kb por núcleo para datos e
instrucciones; y una nueva caché L3 compartida por todos los núcleos y
con diferentes configuraciones en Mb. según el tipo de procesador, 8 Mb
en el caso de un Core i7 con cuatro núcelos, aunque con el tiempo se
irá ampliando esta memoria caché compartida.
Intel tendrá en sus procesadores lo que ha denominado Multi-level
shared cache, esto quiere decir que seguramente tanto la memoria cache
de nivel 2 (L2) como la memoria Cache de nivel 3 (L3) serán memorias
compartidas por cada uno de los núcleos del procesador, esto trae la
ventaja de que se simplifica el diseño de la arquitectura interna del
procesador, pero hay que ser cuidadosos en la forma en al que cada uno
de los cores intenta acceder a la memoria para que no se produzcan
conflictos en los accesos, quizás con un switch interno que administre
las peticiones. Esto por que siempre será mas optimo que cada core
tenga su propio cache y que acceda a el exclusivamente a que tener un
solo Gran cache en que dos, cuatro o mas núcleos intenten acceder a el
provocando, colas o latencias demasiado altas en los accesos, lo que
provoca un contrasentido en la razón de ser del la memoria Cache de un
procesador, la cual es ahorrarse tiempos al tener un cache externo o
tratar de acceder a la memoria principal en tareas críticas.
Intel QuickPath
El procesador Intel Core i7 lleva integrado el controlador de memoria dentro del propio procesador. La tecnología Intel QuickPath Interconnect,
es una tecnología de interconexión con el procesador punto a punto
desarrollada por Intel en competencia con la tecnología HyperTransport
de AMD.
Esta tecnología incluye un controlador
de memoria dentro del propio procesador. Reemplaza al Front Side Bus
(FSB) de los procesador Xeon e Itanium.
El rendimiento de esta tecnología está
reportado para ser de 4,8 a 6,4 Gigatransferencias por segundo (GT/s)
por dirección, y un enlace puede ser 5, 10 o 20 bits de largo en cada
dirección. Además el ancho de banda provisto por un enlace largo
completo asciende de 12,0 a 16,0 GB/s por dirección, o de 24,0 a 32,0
GB/s por enlace.
Admite hasta tres canales de memoria
DDR3 a 1600 Mhz por lo que empezaremos a ver placas con seis slots de
memoria en vez de cuatro.
Integrated Graphics Processor
Tambien incluirá un procesador gráfico
integrado dentro del propio procesador también en respuesta al anuncio
de AMD con su tecnología Fusion que consiste en integrar un procesador
gráfico dentro del propio procesador.
En el caso de Intel Core i7, habrá
versiones distintas de este procesador, unas sin este controlador y
otras con este procesador integrado.
Aunque no veremos procesadores Intel
Conre i7 hasta el año 2.009, la idea es la de incluir una GPU,
procesador gráfico discreto integrado, para modelos concretos, como por
ejemplo portátiles y dispositivos ultra-móviles (UMPC) ya que se
consegurían consumos de energía muy bajos por lo que se aumentaría
considerablemente la duración de las baterías en sistemas móviles como
los portátiles.
Nuevo Conjunto de Instrucciones SSE 4.2
Streaming SIMD Extensions (SSE) es
un conjunto de instrucciones SIMD (Single Instruction, Multiple Data –
Única Instrucción, Múltiples Datos) añadidas en el año 1.999 al
procesador Pentium III, como extension a la arquitectura x86 como
respuesta a la tecnología 3DNow! que AMD tenía implementada años atrás.
La versión 4.2 de las extensiones de
vector de Intel SSE trae de regreso al futuro el x86 ISA atrás con la
adición de nuevas instrucciones de manipulación de cadenas. Digo
“Regreso al futuro” porque el soporte a nivel de cadena de
procesamiento ISA es una característica de las arquitecturas CISC que
se considera obsoleta actualmente en los años post-RISC. Pero la cadena
de instrucciones del nuevo SSE 4,2 están destinadas a acelerar el
procesamiento de XML, lo que las convierte en perfectas para la Web y
aplicaciones futuras basadas en XML.
SSE 4.2 también incluye una
instrucción CRC que acelera el almacenamiento y las aplicaciones de
red, así como una instrucción POPCNT útil para una variedad de tareas
de patrón especificado. Además, para ofrecer mejopr soporte a las
aplicaciones multi-hilo, Intel ha reducido la latencia de los hilos de
las primitivas de sincronización.
En el frente de virtualización, acelera
las transiciones y tiene algunas mejoras sustanciales, que no voy a
detallar aquí, en su sistema de memoria virtual que reduce en gran
medida el número de esas transiciones requeridas por el Hypervisor.
Otras Características
Cuatro unidades de dispatch en vez de tres, lo que se traduce en un
33% más de mejora de proceso de datos por parte del procesador. El
Intel Core i7 podrá ejecutar cuatro microinstrucciones a la vez en
lugar de las tres de Intel Core 2, consiguiendo un aumento considerable
en velocidad.
Además este procesador llevará un segundo buffer de 512-entradas TLB
(Translation Look-aside Buffer). Este circuito es una tabla utilizada
para convertir las direcciones físicas y virtuales por el circuito de
memoria virtual. Añadiendo esta segunda tabla se mejora
considerablemente el rendimiento del procesador.
Un nuevo segundo buffer de predicción de bifurcaciones o BTB (Branch
Target Buffer) y aumentando el tamaño del primer y este segundo nuevo
buffer permitirá carga más instrucciones y predecir con más exactitud
cual es la siguiente instrucción a procesador mejorando aún más el
rendimiento del procesador.
Destaca también el Turbo, que vuelve otra vez a los procesadores
como en las épocas del 386. El modelo a 2,66 podría llegar a 2,8 con el
Turbo en momentos de mucha demanda de proceso, trabajo y carga del
procesador y bajaría la velocidad en momentos de reposo.
Esto facilita también enormemente el trabajo de overclocking, pues
aumentando el multiplicador del turbo se consiguen velocidades
impresionantes con gran facilidad, claro que ello requiere disponer de
buenos sistemas de refrigeración o disipación del procesador, así como
aumentar los voltajes del mismo. Destacar que el modelo Extreme lleva
el multiplicador desbloqueado, facilitando cualquier overcloking,
mientras el resto de procesadores llevan el multiplicador bloqueado,
impidiendo aumentar mucho el rendimiento del procesador, a no ser que
se aumenten manualmente las frecuencias. Ya se puede ver en varias
tiendas que están vendiendo ordenadores con este procesador con overcloking a 4,2 Ghz.
Disponibilidad y Modelos.
Inicialmente en octubre de 2.008 veremos los primeros modelos con
socket LGA1366, cuatro núcleos y 8 Mb. de memoria caché, serán
los Intel Core i7 a velocidades de 2,66 Ghz, 2,93 Ghz y en su version
Extreme Editon a 3,2 Ghz con versiones de doble y triple canal de
memoria DDR3 a 1066 y 1333 y 1600 MHz con buses de memoria de 1x 4.8
GT/s QuickPath, 1x 6.4 GT/s QuickPath y 2x QuickPath. El consumo de
este procesador estará en 130 W.
El primer chipset para este procesador, estará optimizado y desarrollado para trabajar (por desgracia) con Windows Vista, sistema operativo que ofrecerá un mayor rendimiento que Windows XP sobre estos procesadores y chipsets.
Actualización Octubre 2.008.
Actualización Diciembre 2.009.
Sin contar los recientes procesadores aparecidos en el mercado con el nombre Core i7, i5 e i3, con socket 1156, los nuevos Core i7 con socket 1366
y tecnología de 32nm contarán con 6 núcleos (12 unidades de proceso con
Hyperthreading) y llegarán al mercado en el primer trimestre del año
2.010, probablemente en Marzo. Su nombre Intel Core i7 serie 980X.