Información

¿Cómo se comprende la recompensa / penalización?

¿Cómo se comprende la recompensa / penalización?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Técnicamente, el cerebro está compuesto por miles de millones de neuronas para el cálculo abstracto del mundo que nos rodea. Estoy un poco confundido de cómo las emociones como el miedo / la ira son simuladas por la amígdala, que no es más que un montón de neuronas especializadas, pero lo sentimos como una pena. ¿Qué parte del cerebro detecta la respuesta de la amígdala y determina si, eso es miedo / pena? ¿Qué es exactamente la pena?

¿Cómo comprende el ser humano la recompensa y el castigo (miedo / ira / dolor)?


¿Cómo se comprende la recompensa / penalización? - biología

Academia.edu ya no es compatible con Internet Explorer.

Para navegar por Academia.edu e Internet en general de manera más rápida y segura, tómese unos segundos para actualizar su navegador.

, o penaliza, r = O, la red neuronal al disminuir los pesos en un delta inverso
término multiplicado por el producto de la tasa de aprendizaje y un coeficiente de penalización,

× Arp. Nuestra investigación inicial, utilizando un
Señal de recompensa & quot & # 39bounded & quot, r * E <0,. . . , 1>, encontró que el crítico proporciona información de asesoramiento a sigma - pi net
lo que aumenta su eficiencia de entrenamiento. Esto nos llevó a desarrollar una extensión de la crítica adaptativa y asociativa.
metodologías de recompensa-penalización, utilizando una señal de recompensa "ilimitada", r * E <- 1,. . . , 2>, que permite la penalización
de una red incluso cuando el coeficiente de penalización, Arp, se establece en cero, A, p = O. Se debe tener en cuenta que con el estándar
metodología asociativa de recompensa-penalización, la red normalmente solo se penaliza si el coeficiente de penalización es distinto de cero (es decir,
0 & lt Arp

& lt 1). Uno de los enigmas del entrenamiento asociativo de recompensa-penalización (AR-I) es que transmite escasa
información, en forma de una señal de recompensa binaria instantánea, que solo depende del error de salida actual.
Aquí presentamos ACE y AR-I, metodologías para redes sigma-pi, que se basan en rastrear la frecuencia de
• ocurrencia de "estímulos", y luego usar esto para derivar una predicción del refuerzo. Las predicciones se utilizan luego para
derivar una señal de refuerzo que utiliza información temporal. Por tanto, se puede utilizar información más precisa para
Permitir una formación más eficaz. Copyright © 1996 Elsevier Science Ltd

, o penaliza, r = O, la red neuronal al disminuir los pesos en un delta inverso
término multiplicado por el producto de la tasa de aprendizaje y un coeficiente de penalización,

× Arp. Nuestra investigación inicial, utilizando un
Señal de recompensa & quot & # 39bounded & quot, r * E <0,. . . , 1>, encontró que el crítico proporciona información de asesoramiento a sigma - pi net
lo que aumenta su eficiencia de entrenamiento. Esto nos llevó a desarrollar una extensión de la crítica adaptativa y asociativa.
metodologías de recompensa-penalización, utilizando una señal de recompensa "ilimitada", r * E <- 1,. . . , 2>, que permite la penalización
de una red incluso cuando el coeficiente de penalización, Arp, se establece en cero, A, p = O. Se debe tener en cuenta que con el estándar
metodología asociativa de recompensa-penalización, la red normalmente solo se penaliza si el coeficiente de penalización es distinto de cero (es decir,
0 & lt Arp

& lt 1). Uno de los enigmas del entrenamiento asociativo de recompensa-penalización (AR-I) es que transmite escasa
información, en forma de una señal de recompensa binaria instantánea, que solo depende del error de salida actual.
Aquí presentamos ACE y AR-I, metodologías para redes sigma-pi, que se basan en rastrear la frecuencia de
• ocurrencia de "estímulos", y luego usar esto para derivar una predicción del refuerzo. Las predicciones se utilizan luego para
derivar una señal de refuerzo que utiliza información temporal. Por tanto, se puede utilizar información más precisa para
Permitir una formación más eficaz. Copyright © 1996 Elsevier Science Ltd


Sistemas de recompensa y castigo

La idea de un sistema de excitación dirigido por objetivos en el cerebro implica la existencia de algún mecanismo para seleccionar los objetivos apropiados, para iniciar los comportamientos necesarios para alcanzarlos y para señalar cuando se han alcanzado. Si una meta resulta favorable para la supervivencia en las circunstancias prevalecientes, es ventajoso reforzar el comportamiento que conduce a ella si la meta resulta ser desfavorable, la conducta que conduce a ella debe ser suprimida y se deben tomar medidas de evitación en el futuro. Este sistema de señalización puede ser proporcionado por ciertas vías de "recompensa" y "castigo" en el cerebro. Estos están estrechamente integrados con los sistemas de excitación y con el aprendizaje y la memoria, y parecen ser fundamentales para la motivación y para el comportamiento de evitación y búsqueda de objetivos.

Oxford Scholarship Online requiere una suscripción o compra para acceder al texto completo de los libros dentro del servicio. Sin embargo, los usuarios públicos pueden buscar libremente en el sitio y ver los resúmenes y las palabras clave de cada libro y capítulo.

Por favor, suscribirse o iniciar sesión para acceder al contenido de texto completo.

Si cree que debería tener acceso a este título, comuníquese con su bibliotecario.

Para solucionar problemas, consulte nuestras Preguntas frecuentes y, si no puede encontrar la respuesta allí, comuníquese con nosotros.


La recompensa monetaria y el castigo a la inhibición de la respuesta modulan la activación y la sincronización dentro de la red inhibitoria del cerebro

Una recompensa o un castigo pueden modular la motivación y las emociones, que a su vez afectan el procesamiento cognitivo. El presente estudio de electroencefalografía y resonancia magnética funcional simultánea examina los mecanismos neuronales de inhibición de la respuesta bajo la influencia de una recompensa o castigo monetario mediante la implementación de una tarea de señal de parada modificada en un escenario de campo de batalla virtual. Los participantes recibieron instrucciones de jugar como francotiradores que abren fuego contra un objetivo terrorista pero se abstienen de disparar en presencia de un rehén. Los participantes realizaron la tarea bajo tres condiciones de retroalimentación diferentes en orden compensado: una condición de recompensa en la que cada respuesta retenida con éxito agregaba una bonificación (es decir, retroalimentación positiva) al crédito de inicio, una condición de castigo donde cada falla al detenerse deducía una penalización (es decir, retroalimentación negativa) y una condición de no retroalimentación donde el resultado de la respuesta no tuvo consecuencias y sirvió como un entorno de control. Desde el punto de vista del comportamiento, tanto las condiciones de recompensa como de castigo condujeron a una función inhibidora significativamente regulada a la baja en términos del retardo crítico de la señal de parada. En cuanto a los resultados de la neuroimagen, se encontró un aumento de las actividades para la condición de no retroalimentación en las regiones previamente reportadas como asociadas con la inhibición de la respuesta, incluida la circunvolución frontal inferior derecha y el área motora pre-suplementaria. Además, se encontró una mayor activación de la circunvolución lingual, la circunvolución cingulada posterior (PCG) y el lóbulo parietal inferior en la condición de recompensa, mientras que se encontró una activación más fuerte de la circunvolución precuneus en la condición de castigo. La retroalimentación positiva también se asoció con cambios más fuertes de sincronización delta, theta y alfa en el PCG que las condiciones negativas o sin retroalimentación. Estos hallazgos describieron la relación entrelazada entre la inhibición de la respuesta y las redes de motivación.

Palabras clave: electroencefalografía imagen de resonancia magnética funcional motivación sin retroalimentación giro cingulado posterior castigo respuesta inhibición recompensa.

Cifras

Diseño experimental. Presentación de estímulos ...

Diseño experimental. Presentación de estímulos durante tres condiciones que incluyen no retroalimentación, recompensa y castigo ...

Diferentes regiones del cerebro y relacionadas ...

Diferentes regiones del cerebro y ubicaciones de fuentes de dipolos relacionados. Pre-SMA, área del motor pre-suplementaria rMFG,…

La inhibición de respuesta funciona para ...

La inhibición de respuesta funciona para condiciones de no retroalimentación (azul), recompensa (verde) y castigo (rojo).…

Diferencia de tarifas monetarias en ...

Diferencia de tarifas monetarias en condiciones de no retroalimentación, recompensa y castigo. Recompensa (es decir, positiva ...

Regiones cerebrales asociadas a la inhibición de la respuesta ...

Regiones cerebrales asociadas a la inhibición de la respuesta. Activaciones cerebrales asociadas con la no retroalimentación (panel izquierdo),…

Activación cerebral relacionada con la respuesta ...

Activación cerebral relacionada con la inhibición de la respuesta. Panel izquierdo: secciones horizontales debajo de los paneles intermedios de recompensa y no retroalimentación: horizontal…

Activación cerebral significativa en ...

Activación cerebral significativa en las regiones corticales, para recompensa-no-retroalimentación, recompensa-castigo, castigo-recompensa y ...

La perturbación espectral relacionada con eventos (ERSP) ...

La perturbación espectral relacionada con eventos (ERSP) del grupo IFG durante la inhibición de la respuesta. Los…

El análisis ERSP en el pre-SMA del cerebro durante la inhibición de la respuesta. Sólido…

El análisis ERSP en el PCG del cerebro durante la inhibición de la respuesta. Sólido…

El sistema neuronal muestra el ...

El sistema neuronal muestra la activación cerebral diferente y el área de superposición del ...


Skinner identificó tres tipos de respuestas u operantes que pueden seguir el comportamiento.

  1. Operantes neutrales:
    Respuestas del entorno que no aumentan ni disminuyen la probabilidad de que se repita un comportamiento.
  2. Refuerzo (fortalece el comportamiento)
    Una respuesta / consecuencia que hace que un comportamiento ocurra con mayor frecuencia. Los reforzadores pueden ser positivos o negativos.
  3. Castigo (debilita el comportamiento)
    Una respuesta / consecuencia que hace que un comportamiento ocurra con menos frecuencia. Al igual que los refuerzos, puede haber dos tipos de castigo: positivo y negativo.

Contenido

Hay una gran cantidad de entendimientos diferentes de lo que es el castigo. [5]

Castigo es cuando se le hace algo a una persona (o animal) que no le gusta. Puede ser porque rompieron una regla. Hay muchos tipos de castigo, desde la pena de muerte por crímenes horribles, hasta cosas que los padres pueden hacer para castigar a los niños, como azotarlos o quitarles sus juguetes. Las personas a menudo son enviadas a prisión como castigo por un crimen.

El castigo puede considerarse bueno en la sociedad para evitar que las personas hagan cosas malas. También puede verse como cruel e innecesario. También se puede ver que hace más daño que bien.

En filosofía Editar

Varios filósofos han presentado definiciones de castigo. [6] [7] [8] [9] [10] Las condiciones comúnmente consideradas necesarias para describir adecuadamente una acción como castigo son que

  1. es impuesto por una autoridad,
  2. implica alguna pérdida para el supuesto infractor,
  3. es en respuesta a una infracción y
  4. el ser humano (u otro animal) a quien se impone la pérdida debe considerarse al menos algo responsable del delito.

En psicología Editar

Introducido por B.F. Skinner, el castigo tiene una definición más restrictiva y técnica. Junto con el refuerzo, pertenece a la categoría de condicionamiento operante. El condicionamiento operante se refiere al aprendizaje con un castigo (a menudo confundido como refuerzo negativo) o una recompensa que sirve como refuerzo positivo de la lección que se debe aprender. [16] En psicología, el castigo es la reducción de un comportamiento mediante la aplicación de un estímulo desagradable ("positivo castigo ") o la eliminación de un estímulo agradable ("negativo castigo "). Los quehaceres extra o los azotes son ejemplos de castigo positivo, mientras que eliminar el recreo o los privilegios de juego de un estudiante infractor son ejemplos de castigo negativo. La definición requiere que el castigo solo se determine después del hecho mediante la reducción del comportamiento si el comportamiento delictivo de el sujeto no disminuye, no se considera castigo. Existe cierta combinación de castigo y aversivos, aunque una aversión que no disminuye la conducta no se considera castigo en psicología. [17] [18] Además, el "estímulo aversivo" es un Los conductistas etiquetan generalmente a los reforzadores negativos (como en el aprendizaje de evitación), en lugar de a los castigadores.

En sociobiología Editar

El castigo a veces se llama vengativo o agresión moralista [19] se ha observado en todos [ aclaración necesaria ] especies de animales sociales, lo que lleva a los biólogos evolutivos a concluir que se trata de una estrategia evolutivamente estable, seleccionada porque favorece el comportamiento cooperativo. [20] [21]

Ejemplos contra el uso sociobiológico Editar

Una crítica a la afirmación de que todos los animales sociales están evolutivamente programados para el castigo proviene de estudios de animales, como los pulpos cerca de Capri, Italia, que de repente formaron culturas comunales por tener, hasta entonces, vidas solitarias. Durante un período de fuerte pesca y turismo que invadió su territorio, comenzaron a vivir en grupos, aprendiendo unos de otros, especialmente técnicas de caza. Los pulpos pequeños y más jóvenes pueden estar cerca de los pulpos adultos sin que se los coman, aunque ellos, como otros Pulpo vulgaris, fueron caníbales hasta poco antes de la formación del grupo. [ cita necesaria ] Los autores enfatizan que este cambio de comportamiento ocurrió demasiado rápido para ser una característica genética en los pulpos, y que ciertamente no había mamíferos u otros animales sociales "naturalmente" que castigaran a los pulpos por el canibalismo involucrado. Los autores también señalan que los pulpos adoptaron el aprendizaje observacional sin ningún historial evolutivo de adaptación especializada para él. [22] [23]

También hay argumentos en contra de la noción de castigo que requiere inteligencia, basados ​​en estudios de castigo en animales de cerebro muy pequeño como los insectos. Hay pruebas de que las abejas obreras tienen mutaciones que las hacen fértiles poniendo huevos solo cuando otras abejas no las están observando, y que las pocas que quedan atrapadas en el acto mueren. [ cita necesaria ] Esto es corroborado por simulaciones por computadora que demuestran que unas pocas reacciones simples dentro de las opiniones dominantes de la inteligencia extremadamente limitada de los insectos son suficientes para emular el comportamiento "político" observado en los grandes simios. Los autores argumentan que esto falsifica la afirmación de que el castigo evolucionó como una estrategia para tratar con individuos capaces de saber lo que están haciendo. [24]

En el caso de cerebros más complejos, la noción de evolución seleccionando para castigo específico de infracciones de reglas elegidas intencionalmente y / o malhechores capaces de elecciones intencionales (por ejemplo, castigar a humanos por asesinato sin castigar virus letales) está sujeta a críticas de coevolución cuestiones. Ese castigo de personas con determinadas características (incluidas, pero, en principio, no restringidas a las capacidades mentales) selecciona contra esas características, haciendo imposible la evolución de las capacidades mentales consideradas como base de la responsabilidad penal en poblaciones sujetas a tal castigo selectivo. Ciertos científicos argumentan que esto refuta la noción de que los humanos tienen un sentimiento biológico de transgresiones intencionales que merecen ser castigados. [25] [26] [27]

Los castigos se aplican para varios propósitos, más generalmente, para alentar y hacer cumplir el comportamiento adecuado según lo definido por la sociedad o la familia. Los delincuentes son castigados judicialmente, con multas, castigos corporales o penas privativas de libertad, ya que los detenidos en prisión corren el riesgo de sufrir más castigos por infringir las normas internas. [28] Los niños, alumnos y otros aprendices pueden ser castigados por sus educadores o instructores (principalmente padres, tutores o maestros, tutores y entrenadores) - ver Disciplina infantil.

Los esclavos, sirvientes domésticos y otros están sujetos al castigo de sus amos. Los empleados aún pueden estar sujetos a una forma contractual de multa o degradación. La mayoría de las organizaciones jerárquicas, como las fuerzas militares y policiales, o incluso las iglesias, siguen aplicando una disciplina interna bastante rígida, incluso con un sistema judicial propio (consejo de guerra, tribunales canónicos).

El castigo también puede aplicarse por motivos morales, especialmente religiosos, como la penitencia (que es voluntaria) o impuesta en una teocracia con una policía religiosa (como en un estado islámico estricto como Irán o bajo los talibanes) o (aunque no es un verdadero teocracia) por la Inquisición.

La creencia de que el castigo final de un individuo es enviado por Dios, la máxima autoridad, a una existencia en el infierno, un lugar que se cree que existe en el más allá, típicamente corresponde a los pecados cometidos durante su vida. A veces, estas distinciones son específicas, con almas condenadas que sufren por cada pecado cometido (ver, por ejemplo, el mito de Platón de Er o el de Dante). La Divina Comedia), pero a veces son generales, con los pecadores condenados relegados a una o más cámaras del infierno oa un nivel de sufrimiento.

En muchas culturas religiosas, incluido el cristianismo y el islam, el infierno se describe tradicionalmente como ardiente y doloroso, que inflige culpa y sufrimiento. [29] [ especificar ] A pesar de estas descripciones comunes del infierno como un lugar de fuego, algunas otras tradiciones describen el infierno como frío. Las descripciones budistas, y particularmente budistas tibetanas, del infierno presentan un número igual de infiernos fríos y calientes. Entre las descripciones cristianas de Dante Infierno retrata el círculo más interno (noveno) del infierno como un lago helado de sangre y culpa. [30] Pero el frío también jugó un papel en las representaciones cristianas anteriores del infierno, comenzando con el Apocalipsis de Pablo, originalmente de principios del siglo III [31] la "Visión de Dryththelm" por el Venerable Beda del siglo VII [32] " El purgatorio de San Patricio "," La visión de Tundale "o" Visio Tnugdali "y la" Visión del monje de Enysham ", todas del siglo XII [33] y la" Visión de Thurkill "de principios del siglo XIII. [34]

Gravedad de un crimen El castigo se ajusta al crimen Editar

Un principio que se menciona a menudo con respecto al grado de castigo que se debe imponer es que el castigo debe coincidir con el delito. [35] [36] [37] Un estándar de medición es el grado en que un delito afecta a otros oa la sociedad. Se han desarrollado medidas del grado de gravedad de un delito. [38] Un delito grave generalmente se considera un delito de "gran gravedad", mientras que un delito menor no lo es.

Hay muchas razones posibles que podrían darse para justificar o explicar por qué alguien debería ser castigado. Aquí sigue un esquema amplio de justificaciones típicas, posiblemente contradictorias.

Disuasión (prevención) Editar

Dos razones dadas para justificar el castigo [12] es que se trata de una medida para evitar que las personas cometan un delito: disuadir a los infractores anteriores de reincidir y evitar que aquellos que puedan estar contemplando un delito que no han cometido realmente lo cometan. Se pretende que este castigo sea suficiente para que las personas opten por no cometer el delito en lugar de sufrir el castigo. El objetivo es disuadir a todos en la comunidad de cometer delitos.

Algunos criminólogos afirman que el número de personas condenadas por delitos no disminuye como resultado de un castigo más severo y concluyen que la disuasión es ineficaz. [39] Otros criminólogos se oponen a dicha conclusión, citando que si bien la mayoría de la gente no conoce la severidad exacta del castigo, como si la sentencia por asesinato es de 40 años o cadena perpetua, la mayoría de la gente todavía conoce los bosquejos generales, como los castigos por robo a mano armada. o la violación forzada es más severa que los castigos por conducir demasiado rápido o estacionar mal un automóvil. Por lo tanto, estos criminólogos argumentan que la falta de efecto disuasorio del aumento de las penas por delitos ya severamente castigados no dice nada sobre la importancia de la existencia del castigo como factor disuasorio. [40] [41]

Algunos criminólogos argumentan que aumentar las penas por delitos puede hacer que los investigadores penales den mayor prioridad a dichos delitos de manera que un mayor porcentaje de quienes los cometen sean condenados por los mismos, haciendo que las estadísticas den una apariencia falsa de tales delitos aumentando. Estos criminólogos argumentan que el uso de estadísticas para medir la eficiencia de los métodos de lucha contra el crimen es un peligro de crear un truco de recompensa que haga que los sistemas de justicia penal menos eficientes parezcan ser los mejores en la lucha contra el crimen, y que la apariencia de que la disuasión es ineficaz puede ser un ejemplo de esto. [42] [43]

Rehabilitación Editar

Algunos castigos incluyen el trabajo para reformar y rehabilitar al culpable para que no vuelva a cometer el delito. [12] Esto se distingue de la disuasión en que el objetivo aquí es cambiar la actitud del delincuente hacia lo que ha hecho y hacer que se dé cuenta de que su comportamiento fue incorrecto.

Incapacitación y protección social Editar

La incapacitación como justificación del castigo [12] se refiere a la remoción de la capacidad del delincuente para cometer más delitos. El encarcelamiento separa a los delincuentes de la comunidad, por ejemplo, Australia fue un vertedero para los primeros delincuentes británicos. Esta era su forma de eliminar o reducir la capacidad de los delincuentes para llevar a cabo ciertos delitos. La pena de muerte lo hace de forma permanente (e irrevocable). En algunas sociedades, las personas que robaron han sido castigadas con la amputación de las manos.

Retribución Editar

Las actividades delictivas generalmente dan un beneficio al delincuente y una pérdida a la víctima. [44] [45] El castigo se ha justificado como una medida de justicia retributiva, [12] [46] [47] [48] en la que el objetivo es tratar de reequilibrar cualquier ventaja injusta obtenida asegurándose de que el infractor también sufra un pérdida. A veces se ve como una forma de "vengarse" de un malhechor; el sufrimiento del malhechor se ve como un objetivo deseado en sí mismo, incluso si no tiene beneficios reconstituyentes para la víctima. Una de las razones por las que las sociedades han administrado castigos es para disminuir la necesidad percibida de represalia de "justicia callejera", enemistad de sangre y vigilantismo.

Restauración Editar

En el caso de delitos menores, el castigo puede consistir en que el delincuente "corrija el mal" o restituya a la víctima. El servicio comunitario o las órdenes de compensación son ejemplos de este tipo de penalización. [49] En los modelos de justicia restaurativa, las víctimas toman una activo papel en un proceso con sus delincuentes a quienes se alienta a asumir la responsabilidad de sus acciones, "para reparar el daño que han causado, disculpándose, devolviendo el dinero robado o el servicio comunitario". [50] El enfoque de justicia restaurativa tiene como objetivo ayudar al delincuente a querer evitar futuros delitos.

Educación y denuncia Editar

El castigo puede explicarse mediante la teoría de la prevención positiva para utilizar el sistema de justicia penal para enseñar a las personas cuáles son las normas sociales para lo que es correcto y actúa como refuerzo.

El castigo puede servir como un medio para que la sociedad exprese públicamente la denuncia de una acción como criminal. Además de educar a las personas sobre lo que no es un comportamiento aceptable, cumple la doble función de prevenir la justicia de los vigilantes al reconocer la ira pública, mientras que al mismo tiempo disuade la actividad delictiva futura al estigmatizar al delincuente. A esto a veces se le llama la "teoría expresiva" de la denuncia. [51] La picota era un método para realizar la denuncia pública. [52]

Algunos críticos del modelo de educación y denuncia citan problemas evolutivos con la noción de que un sentimiento de castigo como sistema de señales sociales evolucionó si el castigo no era efectivo. Los críticos argumentan que algunos individuos que gastan tiempo y energía y toman riesgos para castigar a otros, y la posible pérdida de los miembros del grupo castigados, se habrían seleccionado en contra si el castigo no tuviera otra función que las señales que podrían evolucionar para funcionar por medios menos riesgosos. [53] [54]

Teoría unificada Editar

Una teoría unificada del castigo reúne múltiples propósitos penales, como la retribución, la disuasión y la rehabilitación, en un marco único y coherente. En lugar de que el castigo requiera que elijamos entre ellos, los teóricos unificados argumentan que trabajan juntos como parte de un objetivo más amplio, como la protección de los derechos. [55]

Algunas personas piensan que el castigo en su conjunto es inútil e incluso perjudicial para las personas contra las que se usa. [56] Los detractores argumentan que el castigo es simplemente incorrecto, del mismo diseño que "dos errores hacen un bien". Los críticos argumentan que el castigo es simplemente venganza. La profesora Deirdre Golash, autora de El caso contra el castigo: retribución, prevención del delito y derecho, dice:

No debemos imponer tal daño a nadie a menos que tengamos una muy buena razón para hacerlo. Esta observación puede parecer trivialmente cierta, pero la historia de la humanidad está plagada de ejemplos de infligir daño deliberadamente por personas bien intencionadas en la búsqueda vana de fines que ese daño no logró, o en la búsqueda exitosa de fines cuestionables. Estos benefactores de la humanidad sacrificaron a sus semejantes para apaciguar a los dioses míticos y los torturaron para salvar sus almas de un infierno mítico, rompieron y ataron los pies de los niños para promover su eventual casabilidad, golpearon a los escolares lentos para promover el aprendizaje y el respeto a los maestros, sometieron a los enfermos. a las sanguijuelas para librarlas del exceso de sangre y poner a los sospechosos al servicio de la verdad. Se educaron a sí mismos para no sentir lástima, para renunciar a la compasión humana al servicio de un fin superior. Hacer daño deliberadamente con la creencia errónea de que promueve un bien mayor es la esencia de la tragedia. Haríamos bien en preguntarnos si los bienes que buscamos para dañar a los delincuentes valen la pena y si los medios que elegimos los asegurarán. [57]

El encarcelamiento significa, como mínimo, la pérdida de libertad y autonomía, así como muchas comodidades materiales, seguridad personal y acceso a relaciones heterosexuales. Estas privaciones, según Gresham Sykes (quien las identificó por primera vez) “juntas causaron 'un profundo dolor' que llegó a 'los cimientos mismos del ser del prisionero. Pero estos son solo los daños mínimos, sufridos por los reclusos menos vulnerables en las cárceles mejor administradas. La mayoría de las cárceles están mal administradas y, en algunas, las condiciones son más miserables que en los peores barrios marginales. En la cárcel del Distrito de Columbia, por ejemplo, los reclusos deben lavar la ropa y las sábanas en los baños de las celdas porque las lavadoras están rotas. Las alimañas y los insectos infestan el edificio, en el que las salidas de aire están obstruidas con la acumulación de polvo y suciedad durante décadas. Pero incluso los reclusos en prisiones donde las condiciones son sanitarias deben afrontar el aburrimiento y el vacío de la vida carcelaria: un vasto desierto de días desperdiciados en el que es posible realizar pocas actividades significativas. [57]

Destructividad para pensar y mejorar Editar

Hay críticos del castigo que argumentan que el castigo dirigido a acciones intencionales obliga a las personas a reprimir su capacidad de actuar intencionalmente. Los defensores de este punto de vista argumentan que tal supresión de la intención hace que los comportamientos dañinos permanezcan, lo que hace que el castigo sea contraproducente. Estas personas sugieren que la capacidad de tomar decisiones intencionales debería valorarse en cambio como una fuente de posibilidades de mejora, citando que la cognición compleja habría sido un desperdicio de energía evolutivamente inútil si hubiera conducido a justificaciones de acciones fijas y ningún cambio como simple incapacidad para comprender los argumentos habría sido la protección más económica de ser engañados por ellos si los argumentos fueran a favor de la manipulación social, y rechazar la condena de las personas que intencionalmente hicieron cosas malas. [58] El castigo puede ser eficaz para detener comportamientos indeseables de los empleados, como tardanzas, ausentismo o desempeño laboral deficiente. Sin embargo, el castigo no necesariamente hace que un empleado demuestre un comportamiento deseable. [59]

  1. ^ Edwards, Jonathan (1824). "La salvación de todos los hombres examinada estrictamente: y el castigo sin fin de los que mueren impenitentes: argumentado y defendido contra las objeciones y razonamientos del difunto reverendo Doctor Chauncy, de Boston en su libro titulado" La salvación de todos los hombres ", & ampc ". C. Ewer y T. Bedlington, 1824: 157. Citar el diario requiere | diario = (ayuda)
  2. ^
  3. Bingham, José (1712). "Volumen 1 de una historia escolástica de la práctica de la Iglesia en referencia a la administración del bautismo por laicos". Una historia escolástica de la práctica de la Iglesia en referencia a la administración del bautismo por laicos. Knaplock, 1712. 1: 25.
  4. ^
  5. Grocio, Hugo (1715). "H. Grocio de los derechos de la guerra y la paz: en tres volúmenes: en los que se explican las leyes y reivindicaciones de la naturaleza y las naciones, y los puntos principales que se relacionan con el gobierno público o con la conducta de la vida privada: juntos con las propias notas del autor: Hecho en inglés. Volumen 2 ". H. Grocio de los derechos de la guerra y la paz: en tres volúmenes: en los que se explican las leyes y demandas de la naturaleza y las naciones, y los puntos principales que se relacionan con el gobierno público o la conducta de la vida privada: junto con Notas del autor: Hecho al inglés por varias manos: Con la adición de la vida del autor por los traductores: Dedicado a Su Alteza Real el Príncipe de Gales, Hugo Grocio. D. Marrón. T. Ward. y W. Meares, 1715. 2: 524.
  6. ^
  7. Lee Hansen, Marcus (1918). "Old Fort Snelling, 1819-1858". Serie Mid-America. Sociedad Histórica del Estado de Iowa, 1918: 124.
  8. ^ aB
  9. Gade, Christian B. N. (2020). "¿Es la justicia restaurativa un castigo?". Resolución de conflictos trimestral. 38 (3): 127-155. doi: 10.1002 / crq.21293.
  10. ^ aB
  11. Hugo, Adam Bedau (19 de febrero de 2010). "Castigo, Crimen y Estado". Enciclopedia de Filosofía de Stanford . Consultado el 4 de agosto de 2010. Es probable que la búsqueda de una definición precisa de castigo que ejercieron algunos filósofos (para discusión y referencias ver Scheid 1980) resulte inútil: pero podemos decir que el castigo legal implica la imposición de algo que se pretende que sea oneroso o doloroso, a una persona. supuesto infractor por un supuesto delito, por parte de una persona u organismo que reclama la autoridad para hacerlo.
  12. ^ aBC y viola la ley o las reglas por las que se rige el grupo.
  13. McAnany, Patrick D. (agosto de 2010). "Castigo". En línea. Enciclopedia Multimedia Grolier. Archivado desde el original el 19 de octubre de 2017. Consultado el 4 de agosto de 2010. El castigo describe la imposición por parte de alguna autoridad de una privación, generalmente dolorosa, a una persona que ha violado una ley, regla u otra norma. Cuando la violación es de la ley penal de la sociedad, hay un proceso formal de acusación y prueba seguido de la imposición de una sentencia por parte de un funcionario designado, generalmente un juez. De manera informal, cualquier grupo organizado, por lo general la familia, en la crianza de los hijos, puede castigar a los supuestos malhechores.
  14. ^ aBC
  15. Hugo, Adam Bedau (19 de febrero de 2010). "Teoría del Castigo". Enciclopedia de Filosofía de Stanford . Consultado el 4 de agosto de 2010. Castigo por ley. es la imposición autorizada de privaciones (de libertad o privacidad u otros bienes a los que la persona tiene derecho, o la imposición de cargas especiales) porque la persona ha sido declarada culpable de alguna infracción penal, que por lo general (aunque no invariablemente) implica daño al inocente. (La formulación clásica, conspicua en Hobbes, por ejemplo, define el castigo por referencia a la imposición del dolor más que a las privaciones). Esta definición, aunque imperfecta debido a su brevedad, nos permite resaltar varios puntos esenciales.
  16. ^ aBCDmi
  17. Peters, Richard Stanley (1966). "Ética y Educación". Revista británica de estudios educativos. 20 (3): 267–68. JSTOR3120772. Castigo. Implica infligir intencionalmente dolor o algo desagradable a alguien que ha infringido las reglas. por alguien que tiene autoridad, que tiene derecho a actuar de esta manera. De lo contrario, sería imposible distinguir "castigo" de "venganza". Las personas con autoridad pueden, por supuesto, infligir dolor a las personas a su antojo. Pero esto se llamaría 'rencor' a menos que se infligiera como consecuencia de una infracción de las reglas por parte del paciente. De manera similar, una persona con autoridad podría dar a una persona £ 5 como consecuencia de su incumplimiento de una regla. But unless this were regarded as painful or at least unpleasant for the recipient it could not be counted as a case of 'punishment'. In other words at least three criteria of (i) intentional infliction of pain (ii) by someone in authority (iii) on a person as a consequence of a breach of rules on his part, must be satisfied if we are to call something a case of 'punishment'. There are, as is usual in such cases, examples that can be produced which do not satisfy all criteria. For instance there is a colloquialism which is used about boxers taking a lot of punishment from their opponents, in which only the first condition is present. But this is a metaphorical use which is peripheral to the central use of the term.


Fondo

Iowa Gambling Task (IGT) assesses decision making in uncertain conditions. Several studies have reported impaired performance on IGT in various clinical population compared to healthy normal. However, some researchers have reported incongruent findings from the basic assumptions of IGT in healthy normal. Our aim was to examine the possible decision making processes on IGT.

Métodos

The IGT was administered on two groups: Healthy normal (n = 34) and offspring at high risk for alcoholism (n = 34). Subjects were matched on age (+/–1 year), education (+/–1 year) and gender. Other tools used were: Mini-international Neuropsychiatric Interview, Family Interview for Genetic Studies, Socio-demographic Data Sheet, Annett’s Handedness Questionnaire.

Resultados

Results showed a significant difference between two groups on selections made from disadvantageous deck A but no significant difference on disadvantageous deck B, advantageous/safe decks C and D. Also, there was no significant difference between two groups on IGT Net score [selections from decks (C + D) – decks (A + B)]. Further analysis showed that varying nature of reward and penalty schedules play an important role in selecting the cards from four decks of IGT. Subjects may prefer infrequent penalty decks without consideration of delayed loss/gain.

Conclusión

Frequency and magnitude of reward/penalty in IGT may adversely impact decision making. Deck B can induce myopia for delayed loss in the healthy normal too because of having a high frequency of gains with high magnitude of reward. Hence, IGT related studies should consider these factors while making an inference about decision making ability.


Types of Machine Learning

There are three main categories of machine learning:

  • Aprendizaje supervisado: The machine learns from labeled data. Normally, the data is labeled by humans.
  • Aprendizaje sin supervisión: The machine learns from un-labeled data. Meaning, there is no “right” answer given to the machine to learn, but the machine must hopefully find patterns from the data to come up with an answer.
  • Aprendizaje reforzado: The machine learns through a reward-based system.

RESULTADOS

Figures 3–5 show how the reward acquisition and button-push behaviors changed during the TEST blocks of the stimulus-action-reward association task for the most successful subject (Fig. 3) and least successful subject (Fig. 4) in terms of total monetary reward, and the average for the 20 subjects (Fig. 5). Accumulated reward (AR) increases almost monotonically in S1–S3 in Fig. 3. In contrast, only S1 exhibits a monotonic increase in Fig. 4, and the flat and decreasing tendencies found in S2 and S3 show that learning was demanding for the subject and that it had not yet been completed within the given number of trials. The averages of all subjects displayed in Fig. 5 show that ARs yielded progressively smaller positive slopes in S1, S2, and S3. Accumulated rewards in the final TEST blocks were significantly larger than zero (PAG & lt 0,0001 t-test) and ranked in the order S1 > S2 > S3 (PAG < 0.05 t-prueba). These observations are consistent with the hypothesis that learning is progressively more difficult in S1, S2, and S3 in accordance with their stochastic uncertainties.

HIGO. 3.Behavioral results of learning for the most successful subject in terms of total reward. AC: time-courses of accumulated reward (AR), SADRP, and RPE. D y F: chronological plots of actual button-pushes by the subjects and corresponding model predictions for each fractal stimulus (FS1–3), respectively, aligned with the subjects' actual rewards (mi). En D y F, light grey and dark grey bars represent a left and right button-push, respectively, whereas in mi, white and black bars represent a reward and penalty, respectively. S1, S2, and S3 represent experimental sessions with a dominant probability of 0.9, 0.8, and 0.7, respectively.


HIGO. 4.Behavioral results of learning for the least successful subject in terms of total reward. All subplots follow format of Fig. 3.


HIGO. 5.Behavioral results of learning for the average and SD of all 20 subjects. Corresponding to Figs. 3 and 4, C.A show time-courses of AR, SADRP, and RPE averaged over 20 subjects. D y mi: proportion of nonoptimal button-pushes by subjects and change in SADRP of the model, respectively.

From their behavior, we estimated each subject's SADRP by the Q-learning model (Sutton and Barto 1998), which is defined as the amount of reward predicted by a subject based on a given contextual stimulus and an action selected by the subject. The RPE amounts simply to the difference between SADRP and an actual reward. SADRP is shown in Figs. 3B, 4B, and 5B. The horizontal lines in Fig. 5B show theoretical maximum values that are expected for optimal button-push <40 yen [=50 × (0.9 −0.1)], 30 yen [=50 × (0.8 − 0.2)], and 20 yen [=50 × (0.7 − 0.3)] for S1–S3, respectively>. In the easiest task (S1), SADRP increased and approached the theoretical maximum (40 yen) within 20 trials for all subjects. In more stochastic tasks (S2 and S3), the increase in SADRP became progressively slower than in S1, and some of the subjects failed to achieve the maximum SADRP even in the final TEST trial. None of the estimated SADRPs of any of the subjects showed a simple monotonically increasing tendency because of the stochasticity of the task. Furthermore, it is even difficult to find general increasing tendency in the more stochastic S2 and S3 tasks among the poorer subjects (e.g., Fig. 4). Considering this nonmonotonic nature of SADRP, the subsequent regression analysis of fMRI data with SADRP did not simply capture the artifact correlated with an arbitrary increasing function in time.

Corresponding to SADRP, the absolute values for RPE shown in Figs. 3C, 4C, and 5C quickly decreased to close to 5 yen within 20 trials in S1, but decreased only slowly in S2 and S3. The absolute value was taken because BOLD signal change in the striatum is assumed to represent the energy consumption that arises from the synaptic plasticity change triggered by the RPE. The spiked increase of RPE found in the final stage of S1 (see Figs. 3C, 4C, and 5C) was induced because an unexpected penalty (−50 yen) with low probability occurred, whereas the majority of subjects predicted a 40-yen reward (−50 − 40 = −90 yen RPE). This is also evident in the average (Fig. 5), because most subjects who had already learned to predict a positive reward received an unexpected penalty at this point because of our use of the same random-number sequence. Again, because of the stochasticity of the task, the RPEs did not exhibit a monotonically decreasing tendency in time. It is also difficult to find generally decreasing patterns in the most stochastic S3 tasks among the poorer subjects (e.g., Fig. 4). Thus regression with RPE again did not simply capture brain activity that was correlated with an arbitrary decreasing function in time.

To evaluate how well the simple Q-learning model predicted each subject's behaviors, Figs. 4D y 5D also compare the actual button-pushes, which subjects selected for each of the fractal stimuli during the TEST trials, and the corresponding behaviors (Figs. 4F y 5F) predicted by the model. These subject and model behaviors were aligned with the actual reward (Figs. 4mi y 5mi), in which a reward and a penalty are labeled in white and black, respectively. In Figs. 4, D y F, and 5, D y F, FS1–3 are represented from cima para fondo, with the abscissa showing the number of trials in the temporal order of presentation of the three stimuli. Light grey and dark grey vertical bars represent left and right button-pushes, respectively. In the model, we assumed that each subject's button-push was selected according to which button-push, left or right, was more advantageous in terms of the SADRP table (deterministic selection: the button with the larger Q is always selected).

The model's predictions showed generally good agreement with subjects' actual behaviors. In the most successful subject (Fig. 3, D y F), the behaviors and predictions were different only in the first few trials, with the discrepancy seeming to arise from a difference in initial strategies, in which the model set the elements of SADRP at 0, thus setting button selection probabilities for left and right equally at 0.5. For the least successful subject (Fig. 4, D y F), the model's predictions and actual behaviors coincided very well in the easiest task (S1), but the degree of agreement decreased progressively in S2 and S3. This subject's behaviors changed more frequently than the model's prediction. A possible reason for the discrepancy is that the subject was naïve to an unfortunate penalty (see also Fig. 4mi) because of stochastic uncertainty and behaved in a shortsighted and non–self-confident way without considering the long-term statistics of reward and penalty. This suggests that the subject was more explorative than the behavior expected from using the Q-learning algorithm. Averaged over all 20 subjects, the mean precision of the model's prediction was 0.92 ± 0.21 (SD), 0.85 ± 0.32, and 0.73 ± 0.42 for S1, S2, and S3, respectively. These values indicate that this parsimonious model simulated the subjects' behaviors reasonably well.

Both the simplicity of the model and its ability to predict behaviors motivated the use of computational internal representations such as SADRP and RPE in the subsequent fMRI analysis. In addition, Fig. 5, D y mi, compare the proportion of nonoptimal button-pushes and the change in SADRP averaged over all subjects. This ratio was determined from the subject's behaviors alone. It decreased most rapidly in S1 and progressively more slowly in S2 and S3, reflecting the increasing stochastic uncertainty and resulting greater difficulty. The later stage of the proportion of nonoptimal button-pushes showed smaller fluctuations than later-stage RPE, although the fluctuations decreased in both with the number of trials. The time-course of the change in SADRP showed a pattern of decay closer to that of the proportion of nonoptimal button-pushes than that of RPE, which continuously fluctuated until the end of the learning trials because of the stochastic uncertainty of the task. This contrast shows that the change in SADRP better explains each subject's behavioral learning (the proportion of nonoptimal button-pushes) than RPE does, suggesting that SADRP better reflects the internal representations responsible for behavioral learning. In summary, all of the observations described above indicate that the learning strategy of the human subjects is reasonably comparable with a very simple computational model based on SADRP and RPE.


Ver el vídeo: CUÁNTO VAS A GANAR CON CRYPTOCARSWORLD. ANÁLISIS COMPLETO DEL WHITEPAPER (Mayo 2022).