Consultas respecto a la carga de datos de fuentes estaticas #491
-
|
Beta Was this translation helpful? Give feedback.
Replies: 1 comment 1 reply
-
Hola @LautaroMelchiori
En principio, si. No estaría mal si hicieran algo más sofisticado, que implemente una cache sobre eso para minimizar el tiempo de parseo, pero esta entrega no lo requiere. Como ya mencionamos en otras respuestas, se busca no sobrecargar la memoria. Y algo más, secundario, que se me pasó mencionar anteriormente: posibilitar que si el archivo (ocasionalmente) cambia, no haya necesidad de reiniciar el servidor.
Queda a tu criterio: pueden explorar cualquiera de ambas opciones. Lo único que nos interesa en este punto es no sostener cientos, miles o potencialmente millones de registros cargados todo el tiempo en la memoria del proceso (servidor) Java.
Ignorarlo sería la última opción, y aún si así lo hicieran, deberían generar algún tipo de reporte de lo que falló. Imaginen que cargan un archivo de 2000 entradas y solo se cargan 1500: ¿se trata de un error del sistema? ¿O falta información en el archivo? ¿Podría el sistema brindarnos alguna información útil para corregir la información? Dicho eso, como mencioné en alguna discusión, deberían apuntar primero a tratar de subsanar las entradas. ¿Podrían generar algún valor a partir de otro? ¿Podría haber algún valor por defecto? ¿Se podría tratar algún valor como opcional? ¿Que implicancias tendría? Todo eso lo dejo a su criterio.
Sí, este es un problema típico y real al trabajar con archivos csv.
Coincido. O al menos, no estar acoplada en su propio código a cada uno de los formatos propuestos.
Es una idea interesante y válida. ¿Cómo piensan hacerlo? Por las dudas aclaro (sobre todo para otras personas que lean este hilo y tengan otras opciones en mente) que esa es sólo una opción, y lidiar con múltiples esquemas podría ser resuelto en otros componentes del sistema.. Finalmente, como recomendación final, me parece importante que piensen en este problema que trajiste (hacer extensible el sistema a diferentes formatos de csv) y que exploren cada uno de los ejemplos para estudiar donde puede haber diferencias. Sin embargo, para la entrega sugiero que se concentren, de mínima, en un dataset particular que les resulte de interés (u otro que tengan, si lo quieren proponer) y orienten la presentación a hacer una demostración del servicio de fuente estática cargando ese dataset, asociando a una colección con un criterio particular y posibilitando el filtrado de esos hechos según criterios particulares. Digo esto porque el sistema necesita ser extensible en todos esos ejes, pero para hacer una demo les será conveniente mostrar un caso particular. |
Beta Was this translation helpful? Give feedback.
Hola @LautaroMelchiori
En principio, si.
No estaría mal si hicieran algo más sofisticado, que implemente una cache sobre eso para minimizar el tiempo de parseo, pero esta entrega no lo requiere.
Como ya mencionamos en otras respuestas, se busca no sobrecargar la memoria. Y algo más, secundario, que se me pasó mencionar anteriormente: posibilitar que si el archivo (ocasionalmente) cambia, no haya necesidad de reiniciar el servidor.
Queda a tu criterio: pue…