programing

mysql의 문자열에서 숫자만 가져오는 방법?

muds 2023. 9. 28. 08:49
반응형

mysql의 문자열에서 숫자만 가져오는 방법?

영숫자 값이 포함된 문자열 출력이 있습니다.저는 그 문자열에서 숫자만 얻고 싶습니다.쿼리로 가져오려면 어떻게 해야 합니까?어떤 MySql 함수를 사용할 수 있습니까?

제 질문은 다음과 같습니다.

select DISTINCT SUBSTRING(referrerURL,71,6)   
from   hotshotsdblog1.annonymoustracking   
where  advertiserid = 10 
limit  10;

출력 :

100683
101313
19924&
9072&h
12368&
5888&h
10308&
100664
1&hash
101104

다음과 같은 출력을 원합니다.

100683
101313
19924
9072
12368
5888 
10308
100664
1
101104

문자열이 숫자로 시작하여 숫자가 아닌 문자를 포함하는 경우 함수를 사용하거나 다음을 추가하여 암시적으로 숫자로 변환할 수 있습니다.0:

SELECT CAST('1234abc' AS UNSIGNED); -- 1234
SELECT '1234abc'+0; -- 1234

임의의 문자열에서 숫자를 추출하려면 다음과 같은 사용자 정의 함수를 추가할 수 있습니다.

DELIMITER $$

CREATE FUNCTION `ExtractNumber`(in_string VARCHAR(50)) 
RETURNS INT
NO SQL
BEGIN
    DECLARE ctrNumber VARCHAR(50);
    DECLARE finNumber VARCHAR(50) DEFAULT '';
    DECLARE sChar VARCHAR(1);
    DECLARE inti INTEGER DEFAULT 1;

    IF LENGTH(in_string) > 0 THEN
        WHILE(inti <= LENGTH(in_string)) DO
            SET sChar = SUBSTRING(in_string, inti, 1);
            SET ctrNumber = FIND_IN_SET(sChar, '0,1,2,3,4,5,6,7,8,9'); 
            IF ctrNumber > 0 THEN
                SET finNumber = CONCAT(finNumber, sChar);
            END IF;
            SET inti = inti + 1;
        END WHILE;
        RETURN CAST(finNumber AS UNSIGNED);
    ELSE
        RETURN 0;
    END IF;    
END$$

DELIMITER ;

함수가 정의되면 쿼리에서 함수를 사용할 수 있습니다.

SELECT ExtractNumber("abc1234def") AS number; -- 1234

아직 찾고 있는 사람은 regex를 사용합니다.

select REGEXP_SUBSTR(name,"[0-9]+") as amount from `subscriptions`

여기서 저는 이 기능으로 성공을 거두었습니다.

select REGEXP_REPLACE('abc12.34.56-ghj^-_~#@!', '[^0-9]+', '')

출력:123456

설명: 기본적으로 mysql에서 0에서 9까지의 간격으로 모든 'not number'를 교체할 것을 요청합니다.

유진 야매쉬 앤서를 바탕으로.다음은 소수점 두 자리로 소수점을 추출하는 사용자 정의 함수 버전입니다.가격 추출에 좋습니다.

DELIMITER $$

CREATE FUNCTION `ExtractDecimal`(in_string VARCHAR(255)) 
RETURNS decimal(15,2)
NO SQL
BEGIN
    DECLARE ctrNumber VARCHAR(255);
    DECLARE in_string_parsed VARCHAR(255);
    DECLARE digitsAndDotsNumber VARCHAR(255) DEFAULT '';
    DECLARE finalNumber VARCHAR(255) DEFAULT '';
    DECLARE sChar VARCHAR(1);
    DECLARE inti INTEGER DEFAULT 1;
    DECLARE digitSequenceStarted boolean DEFAULT false;
    DECLARE negativeNumber boolean DEFAULT false;

    -- FIX FIND_IN_SET cannot find a comma ","
    SET in_string_parsed = replace(in_string,',','.');

    IF LENGTH(in_string_parsed) > 0 THEN
        -- extract digits and dots
        WHILE(inti <= LENGTH(in_string_parsed)) DO
            SET sChar = SUBSTRING(in_string_parsed, inti, 1);
            SET ctrNumber = FIND_IN_SET(sChar, '0,1,2,3,4,5,6,7,8,9,.'); 
            IF ctrNumber > 0 AND (sChar != '.' OR LENGTH(digitsAndDotsNumber) > 0) THEN
                -- add first minus if needed
                IF digitSequenceStarted = false AND inti > 1 AND SUBSTRING(in_string_parsed, inti-1, 1) = '-' THEN
                    SET negativeNumber = true;
                END IF;

                SET digitSequenceStarted = true;
                SET digitsAndDotsNumber = CONCAT(digitsAndDotsNumber, sChar);
            ELSEIF digitSequenceStarted = true THEN
                SET inti = LENGTH(in_string_parsed);
            END IF;
            SET inti = inti + 1;
        END WHILE;

        -- remove dots from the end of number list
        SET inti = LENGTH(digitsAndDotsNumber);
        WHILE(inti > 0) DO
            IF(SUBSTRING(digitsAndDotsNumber, inti, 1) = '.') THEN
                SET digitsAndDotsNumber = SUBSTRING(digitsAndDotsNumber, 1, inti-1);
                SET inti = inti - 1;
            ELSE
                SET inti = 0;
            END IF;
        END WHILE;

        -- extract decimal
        SET inti = 1;
        WHILE(inti <= LENGTH(digitsAndDotsNumber)-3) DO
            SET sChar = SUBSTRING(digitsAndDotsNumber, inti, 1);
            SET ctrNumber = FIND_IN_SET(sChar, '0,1,2,3,4,5,6,7,8,9'); 
            IF ctrNumber > 0 THEN
                SET finalNumber = CONCAT(finalNumber, sChar);
            END IF;
            SET inti = inti + 1;
        END WHILE;

        SET finalNumber = CONCAT(finalNumber, RIGHT(digitsAndDotsNumber, 3));
        IF negativeNumber = true AND LENGTH(finalNumber) > 0 THEN
            SET finalNumber = CONCAT('-', finalNumber);
        END IF;

        IF LENGTH(finalNumber) = 0 THEN
            RETURN 0;
        END IF;

        RETURN CAST(finalNumber AS decimal(15,2));
    ELSE
        RETURN 0;
    END IF;    
END$$

DELIMITER ;

테스트:

select ExtractDecimal("1234"); -- 1234.00
select ExtractDecimal("12.34"); -- 12.34
select ExtractDecimal("1.234"); -- 1234.00
select ExtractDecimal("1,234"); -- 1234.00
select ExtractDecimal("1,111,234"); -- 11111234.00
select ExtractDecimal("11,112,34"); -- 11112.34
select ExtractDecimal("11,112,34 and 123123"); -- 11112.34
select ExtractDecimal("-1"); -- -1.00
select ExtractDecimal("hello. price is 123"); -- 123.00
select ExtractDecimal("123,45,-"); -- 123.45

다음은 유진 야마쉬의 ExtractNumber 기능에 대한 개선사항입니다.

그것은 숫자가 아닌 문자뿐만 아니라 다음과 같은 HTML 엔티티도 제거합니다.&#[0-9];, 숫자가 아닌 유니코드 문자로 간주해야 합니다.

여기 순수 MySQL <8>에 UDP가 없는 코드가 있습니다.

CREATE DEFINER = 'user'@'host' FUNCTION `extract_number`(
        str CHAR(255)
    )
    RETURNS char(255) CHARSET utf8mb4 COLLATE utf8mb4_unicode_ci
    DETERMINISTIC
    NO SQL
    SQL SECURITY DEFINER
    COMMENT ''
BEGIN
  DECLARE tmp VARCHAR(255);
  DECLARE res VARCHAR(255) DEFAULT "";
  DECLARE chr VARCHAR(1);
  DECLARE len INTEGER UNSIGNED DEFAULT LENGTH(str);
  DECLARE i INTEGER DEFAULT 1;

  IF len > 0 THEN
    WHILE i <= len DO
      SET chr = SUBSTRING(str, i, 1);

      /* remove &#...; */
      IF "&" = chr AND "#" = SUBSTRING(str, i+1, 1) THEN
        WHILE (i <= len) AND (";" != SUBSTRING(str, i, 1)) DO
          SET i = i + 1;
        END WHILE;
      END IF;

      SET tmp = FIND_IN_SET(chr, "0,1,2,3,4,5,6,7,8,9");
      IF tmp > 0 THEN
        SET res = CONCAT(res, chr);
      END IF;
      SET i = i + 1;
    END WHILE;
    RETURN res;
  END IF;

  RETURN 0;
END;

그러나 UDP의 PREG_REFACE를 사용하는 경우 다음 줄만 사용할 수 있습니다.

RETURN PREG_REPLACE("/[^0-9]/", "", PREG_REPLACE("/&#[0-9]+;/", "", str));

MemSQL 구문에 대해 다시 작성했습니다.

DROP FUNCTION IF EXISTS GetNumeric;
DELIMITER //
CREATE FUNCTION GetNumeric(str CHAR(255)) RETURNS CHAR(255) AS
  DECLARE i SMALLINT = 1;
  DECLARE len SMALLINT = 1;
  DECLARE ret CHAR(255) = '';
  DECLARE c CHAR(1);

BEGIN
  IF str IS NULL
  THEN 
    RETURN "";
  END IF;

  WHILE i < CHAR_LENGTH( str ) + 1 LOOP
    BEGIN
      c = SUBSTRING( str, i, 1 );
      IF c BETWEEN '0' AND '9' THEN
        ret = CONCAT(ret,c);
      END IF;
      i = i + 1;
    END;
  END LOOP;
  RETURN ret;
 END //
DELIMITER ;

SELECT GetNumeric('abc123def456xyz789') as test;

유진 야르마쉬와 마틴스 발로디스의 답변을 바탕으로 합니다.

제 경우에는 소스 문자열에 소수 구분자로 점이 포함되어 있는지 여부를 몰랐습니다.하지만 구체적인 칼럼이 어떻게 다뤄져야 하는지는 알고 있었습니다.예를 들어 값이 "10,00" 시간으로 표시되고 "1.00"이 아닌 경우 마지막 구분자 문자는 점 10진수 구분자로 처리해야 함을 알고 있습니다.이를 위해 마지막 쉼표 구분자가 어떻게 동작할지 지정하는 보조 부울 매개 변수를 사용할 수 있습니다.

DELIMITER $$
CREATE FUNCTION EXTRACT_DECIMAL(
    inString            VARCHAR(255)
,   treatLastCommaAsDot BOOLEAN
) RETURNS varchar(255) CHARSET utf8mb4
    NO SQL
    DETERMINISTIC
BEGIN
    DECLARE ctrNumber             VARCHAR(255);
    DECLARE inStringParsed        VARCHAR(255);
    DECLARE digitsAndDotsNumber   VARCHAR(255) DEFAULT '';
    DECLARE digitsBeforeDotNumber VARCHAR(255) DEFAULT '';
    DECLARE digitsAfterDotNumber  VARCHAR(255) DEFAULT '';
    DECLARE finalNumber           VARCHAR(255) DEFAULT '';
    DECLARE separatorChar         VARCHAR(1)   DEFAULT '_';
    DECLARE iterChar              VARCHAR(1);
    DECLARE inti                  INT          DEFAULT 1;
    DECLARE digitSequenceStarted  BOOLEAN      DEFAULT false;
    DECLARE negativeNumber        BOOLEAN      DEFAULT false;

    -- FIX FIND_IN_SET cannot find a comma ","
    -- We need to separate entered dot from another delimiter characters.
    SET inStringParsed = TRIM(REPLACE(REPLACE(inString, ',', separatorChar), ' ', ''));

    IF LENGTH(inStringParsed) > 0 THEN
        -- Extract digits, dots and delimiter character.
        WHILE(inti <= LENGTH(inStringParsed)) DO
            -- Might contain MINUS as the first character.
            SET iterChar  = SUBSTRING(inStringParsed, inti, 1);
            SET ctrNumber = FIND_IN_SET(iterChar, CONCAT('0,1,2,3,4,5,6,7,8,9,.,', separatorChar));

            -- In case the first extracted character is not '.' and `digitsAndDotsNumber` is set.
            IF ctrNumber > 0 AND (iterChar != '.' OR LENGTH(digitsAndDotsNumber) > 0) THEN
                -- Add first minus if needed. Note: `inti` at this point will be higher than 1.
                IF digitSequenceStarted = FALSE AND inti > 1 AND SUBSTRING(inStringParsed, inti - 1, 1) = '-' THEN
                    SET negativeNumber = TRUE;
                END IF;

                SET digitSequenceStarted = TRUE;
                SET digitsAndDotsNumber  = CONCAT(digitsAndDotsNumber, iterChar);
            ELSEIF digitSequenceStarted = true THEN
                SET inti = LENGTH(inStringParsed);
            END IF;

            SET inti = inti + 1;
        END WHILE;
       
        -- Search the left part of string until the separator.
        -- https://stackoverflow.com/a/43699586
        IF (
            -- Calculates the amount of delimiter characters.
            CHAR_LENGTH(digitsAndDotsNumber) 
            - CHAR_LENGTH(REPLACE(digitsAndDotsNumber, separatorChar, SPACE(LENGTH(separatorChar)-1)))
        ) + (
            -- Calculates the amount of dot characters.
            CHAR_LENGTH(digitsAndDotsNumber)
            - CHAR_LENGTH(REPLACE(digitsAndDotsNumber, '.', SPACE(LENGTH(separatorChar)-1)))
        ) > 0 THEN
            -- If dot is present in the string. It doesn't matter for the other characters.
            IF LOCATE('.', digitsAndDotsNumber) != FALSE THEN
                -- Replace all special characters before the dot.
                SET inti = LOCATE('.', digitsAndDotsNumber) - 1;
                -- Return the first half of numbers before the last dot.
                SET digitsBeforeDotNumber = SUBSTRING(digitsAndDotsNumber, 1, inti);
                SET digitsBeforeDotNumber = REPLACE(digitsBeforeDotNumber, separatorChar, '');
            
                SET digitsAfterDotNumber  = SUBSTRING(digitsAndDotsNumber, inti + 2, LENGTH(digitsAndDotsNumber) - LENGTH(digitsBeforeDotNumber));
                SET digitsAndDotsNumber   = CONCAT(digitsBeforeDotNumber, '.', digitsAfterDotNumber);
            ELSE
                IF treatLastCommaAsDot = TRUE THEN
                    -- Find occurence of the last delimiter within the string.
                    SET inti = CHAR_LENGTH(digitsAndDotsNumber) - LOCATE(separatorChar, REVERSE(digitsAndDotsNumber));
                    -- Break the string into left part until the last occurrence of separator character.
                    SET digitsBeforeDotNumber = SUBSTRING(digitsAndDotsNumber, 1, inti);
                    SET digitsBeforeDotNumber = REPLACE(digitsBeforeDotNumber, separatorChar, '');
                
                    SET digitsAfterDotNumber  = SUBSTRING(digitsAndDotsNumber, inti + 2, LENGTH(digitsAndDotsNumber) - LENGTH(digitsBeforeDotNumber));
                    -- Remove any dot occurence from the right part.
                    SET digitsAndDotsNumber   = CONCAT(digitsBeforeDotNumber, '.', REPLACE(digitsAfterDotNumber, '.', ''));
                ELSE
                    SET digitsAndDotsNumber   =  REPLACE(digitsAndDotsNumber, separatorChar, '');
                END IF;
            END IF;
        END IF;
       
        SET finalNumber = digitsAndDotsNumber;
        IF negativeNumber = TRUE AND LENGTH(finalNumber) > 0 THEN
            SET finalNumber = CONCAT('-', finalNumber);
        END IF;

        IF LENGTH(finalNumber) = 0 THEN
            RETURN 0;
        END IF;

        RETURN CAST(finalNumber AS DECIMAL(25,5));
    ELSE
        RETURN 0;
    END IF;
END$$

DELIMITER ;
 

다음은 몇 가지 사용 예입니다.

-- 
-- SELECT EXTRACT_DECIMAL('-711,712,34 and 123123', FALSE);  -- -71171234.00000
-- SELECT EXTRACT_DECIMAL('1.234', FALSE);                   -- 1.23400
-- SELECT EXTRACT_DECIMAL('1,234.00', FALSE);                -- 1234.00000
-- SELECT EXTRACT_DECIMAL('14 9999,99', FALSE);              -- 14999999.00000
-- SELECT EXTRACT_DECIMAL('-149,999.99', FALSE);             -- -149999.99000
-- SELECT EXTRACT_DECIMAL('3 536 500.53', TRUE);             -- 3536500.53000
-- SELECT EXTRACT_DECIMAL('3,536,500,53', TRUE);             -- 3536500.53000
-- SELECT EXTRACT_DECIMAL("-1");                             -- -1.00000
-- SELECT EXTRACT_DECIMAL('2,233,536,50053', TRUE);          -- 2233536.50053
-- SELECT EXTRACT_DECIMAL('13.01666667', TRUE);              -- 13.01667
-- SELECT EXTRACT_DECIMAL('1,00000000', FALSE);              -- 100000000.00000
-- SELECT EXTRACT_DECIMAL('1000', FALSE);                    -- 1000.00000
-- ==================================================================================

시도, 쿼리 수준,

 SELECT CAST('1&hash' AS UNSIGNED);

PHP의 경우,

echo intval('13213&hash');

비슷한 요청을 받은 신입에게는 이것이 정확히 당신에게 필요한 것이어야 합니다.

    select DISTINCT CONVERT(SUBSTRING(referrerURL,71,6), SIGNED) as `foo`
    from   hotshotsdblog1.annonymoustracking   
    where  advertiserid = 10 
    limit  10;

피벗 테이블(예: 1에서 적어도 문자열의 길이까지 순서가 매겨진 숫자 벡터만 포함하는 테이블)을 사용한 다음 다음 다음을 수행할 것을 제안합니다.

SELECT group_concat(c.elem separator '')
from (
select b.elem 
from
(
select substr('PAUL123f3211',iter.pos,1) as elem
from (select id as pos from t10) as iter 
where iter.pos <= LENGTH('PAUL123f3211')
) b
where b.elem REGEXP '^[0-9]+$') c

대신 PHP로 할 수 있습니다.

foreach ($query_result as &$row) {
  $row['column_with_numbers'] = (int) filter_var($query_result['column_with_numbers'], FILTER_SANITIZE_NUMBER_INT);
}

이것을 php로 시도해보세요.

$string = '9072&h';
echo preg_replace("/[^0-9]/", '', $string);// output: 9072

또는 이 링크를 따라 MySql에서 이 작업을 수행합니다. 링크를 참조하십시오.

언급URL : https://stackoverflow.com/questions/37268248/how-to-get-only-digits-from-string-in-mysql

반응형