Tens 2 canales
Runtimeerror bitwise_or_cpu no implementado para float
Ya existe una etiqueta con el nombre de rama proporcionado. Muchos comandos Git aceptan tanto nombres de etiqueta como de rama, por lo que crear esta rama puede causar un comportamiento inesperado. ¿Estás seguro de que quieres crear esta rama?
El tensor de entrada a un resnet podría tener la forma [8, 3, 224, 224] pero informalmente pensamos en esas dimensiones como 'lote', 'canal', 'anchura' y 'altura'. Aunque la "anchura" y la "altura" tengan el mismo tamaño, seguimos pensando en ellas como dimensiones separadas, y si tenemos dos imágenes diferentes, pensamos que ambas comparten la misma dimensión "canal".
Los tensores con nombre dan nombre a estas dimensiones. La implementación actual de PyTorch utiliza cadenas para nombrar las dimensiones. En su lugar, esta biblioteca introduce un objeto Python, un Dim, para representar el concepto. Ampliando la semántica de los tensores con objetos dim, además de nombrar dimensiones, podemos obtener un comportamiento equivalente al de las transformaciones por lotes (xmap, vmap), la reordenación al estilo einops y la indexación de tensores al estilo bucle.
Puede crear tensores con dimensiones de primera clase indexando las dimensiones posicionales normales de un tensor con un objeto de dimensión. La propiedad ndim sigue enumerando el número de dimensiones posicionales, mientras que la nueva propiedad dims enumera todas las dimensiones de primera clase vinculadas.
Pytorch añade un canal al tensor
Así que hemos aprendido acerca de lo que es un tensor, y sabemos un poco acerca de lo que se puede hacer con ellos, pero ¿por qué diablos querríamos convertir una imagen en un tensor? Bueno, si queremos usarlas con TensorFlow.js o para Deep Learning, entonces las cambiamos a tensores para ponerlas en una forma utilizable.
Cuando pensamos en imágenes, sabemos que están hechas de píxeles. Juntas, esas pequeñas unidades crean una imagen. Cada uno de esos píxeles ocupa una posición en la imagen, y cada píxel puede representarse mediante una matriz de tres números que se corresponden con un valor RGB (rojo, verde, azul) que representa un color.
Así, por ejemplo, si miramos el valor rgb (0, 255, 255), veremos aqua. Ahora, puede que veas un cuarto valor, que representa la transparencia del píxel. Ese cuarto valor -el parámetro alfa- te permite establecer un número entre 0,0 (transparente) y 1,0 (opaco). Tomemos el color aqua. Si añadimos un parámetro alfa de 0, será totalmente transparente y no podremos verlo. Si añadimos 0.5, entonces estará en un punto medio para la transparencia.
La antorcha combina dos dimensiones
Sorprendentemente no he encontrado respuesta a esta pregunta después de buscar por internet. Estoy interesado específicamente en un tensor 3d. Haciendo mis propios experimentos, he encontrado que cuando creo un tensor:
El primer número representa el Batchsize (N) y para los tensores que contienen datos de una dimensión de 1 o superior la siguiente dimensión se suele denominar channel-dimension. Las siguientes dimensiones suelen ser altura, anchura y profundidad.
Gracias por su respuesta. ¿Y si quiero aplicar una convolución unidimensional a una imagen 2D? ¿Debo entonces decir que en lugar de un kernel 1d de tamaño 3, debo definirlo como un kernel 2d de tamaño (3,1)?
Puedes elegir entre remodelar tu tensor a NxCx(H*W), aplicar una convolución 1d y remodelar el resultado o usar el kernel (1,3) en la convolución 2d. Matemáticamente estos enfoques deben ser equivalentes, pero yo recomendaría la forma de utilizar la convolución 2d ya que no tiene que prestar atención en el orden de memoria, mientras que la remodelación.
Torch añade dos tensores
ResumenEl análisis de tensores sienta las bases matemáticas para la próspera promoción del procesamiento multidireccional de señales. Para aumentar el rendimiento informático, los procesadores convencionales transforman las convoluciones de tensores en multiplicaciones de matrices para aumentar el paralelismo de la computación. Sin embargo, esta transformación que reduce el orden produce duplicados de datos y consume memoria adicional. Aquí proponemos un procesador de flujo tensorial fotónico integrado (PTFP) que no duplica digitalmente los datos de entrada. Produce el tensor convolucionado a medida que el tensor de entrada "fluye" a través del procesador. La manipulación híbrida de longitudes de onda ópticas, dimensiones espaciales y pasos de retardo temporal permite la representación directa y el procesamiento de tensores de alto orden en el dominio óptico. En el experimento de prueba de concepto, se implementa un procesador integrado que manipula longitudes de onda y pasos de retardo para demostrar las funcionalidades clave de PTFP. Las imágenes y vídeos multicanal se procesan a una velocidad de modulación de 20 Gbaud. Se demuestra en el procesador una red neuronal convolucional para el reconocimiento de acciones en vídeo, que alcanza una precisión del 97,9%.