/* { dg-options "-O2" } */

#pragma GCC aarch64 "arm_neon.h"
typedef __Uint8x8_t uint8x8_t;
typedef __Uint16x4_t uint16x4_t;
typedef __Int16x8_t int16x8_t;
typedef __Uint16x8_t uint16x8_t;
int jsimd_extbgrx_ycc_convert_neon_image_width,
    jsimd_extbgrx_ycc_convert_neon___trans_tmp_1;
uint16x4_t jsimd_extbgrx_ycc_convert_neon___trans_tmp_2;
uint16x8_t vcombine_u16();
uint16x8_t vmovl_u8(uint8x8_t __a) {
  return __builtin_aarch64_uxtlv8hi_uu(__a);
}
__inline int __attribute__((__gnu_inline__)) vmull_laneq_u16();
uint8x8x4_t vld4_u8();
void jsimd_extbgrx_ycc_convert_neon() {
  int scaled_128_5 = jsimd_extbgrx_ycc_convert_neon___trans_tmp_1,
      cols_remaining = jsimd_extbgrx_ycc_convert_neon_image_width;
  for (;;)
    if (cols_remaining) {
      uint8x8x4_t input_pixels = vld4_u8();
      uint16x8_t r = vmovl_u8(input_pixels.val[2]);
      uint16x8_t g = vmovl_u8(input_pixels.val[1]);
      uint16x8_t b = vmovl_u8(input_pixels.val[0]);
      int y_l = vmull_laneq_u16(r);
      uint16x8_t __a = g;
      jsimd_extbgrx_ycc_convert_neon___trans_tmp_2 =
          (uint16x4_t)vget_low_s16((int16x8_t)__a);
      __a = b;
      int cb_l = scaled_128_5;
      int cb_h = scaled_128_5;
      int cr_l = scaled_128_5;
      int cr_h = scaled_128_5;
      uint16x8_t y_u16 = vcombine_u16(y_l);
      uint16x8_t cb_u16 = vcombine_u16(cb_l, cb_h);
      uint16x8_t cr_u16 = vcombine_u16(cr_l, cr_h);
      __a = y_u16 = cb_u16 = cr_u16;
    }
}